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Cuvânt înainte 


Procesarea imaginilor este un domeniu relativ recent, care evoluează rapid. 
Aplicaţiile sale se întâlnesc pretutindeni: în medicină, armată, industrie, 
artă sau acolo unde informaţia din mediul înconjurător este reprezentată sub 
formă de imagini. Principala aplicaţie o reprezintă îmbunătăţirea informaţiei 
conţinute de imagini în vederea interpretării de către un subiect uman sau 
pentru vederea artificială a roboţilor. 


Odată cu răspândirea aparatelor de fotografiat digitale, procesarea ima¬ 
ginilor nu mai este domeniul exclusiv al oamenilor de ştiinţă sau al ingine¬ 
rilor. Aplicaţiile de procesare a imaginilor au pătruns în casa oricărui fo¬ 
tograf amator, fiind utilizate pentru retuşarea fotografiilor digitale. 


îndrumarul de faţă se adresează în special studenţilor de la facultăţile 
tehnice, care urmează cursul de Procesarea imaginilor, dar şi celor care 
doresc să îşi însuşească algoritmii fundamentali de procesare a imaginilor. 
Lucrările de laborator prezentate abordează operaţiile punctuale, de vecină¬ 
tate şi cele integrale, de la accentuarea contrastului până la transformări 
unitare. Ultimul capitol, referitor la segmentarea imaginilor, reprezintă o 
incursiune în domeniul analizei imaginilor. 


Scopul lucrărilor de laborator este acela de a prezenta noţiunile funda¬ 
mentale de procesare a imaginilor alb-negru şi de a exemplifica folosind lim¬ 
bajul C~|—b modalităţi de implementare a algoritmilor de procesare prezentaţi. 
Pentru o înţelegere cât mai bună a soluţiilor propuse, cititorul trebuie să fie 
familiarizat cu limbajele de programare C şi C++. 




Lucrarea 1 


Noţiuni introductive de Qt 


Qt 1 este un mediu de dezvoltare care include biblioteci de clase C++ şi 
unelte de dezvoltare de aplicaţii pentru diverse sisteme de operare: Microsoft 
Windows, MAC OS sau Linux. 

Bibliotecile Qt cuprind peste 400 de clase C++, care încapsulează in¬ 
frastructura necesară pentru dezvoltarea de aplicaţii. Qt API 2 include clase 
pentru realizarea de interfeţe grafice utilizator, pentru programarea în reţea, 
baze de date sau integrare OpenGL 3 . 

1.1 Clasa QApplication 

Clasa QApplication controlează şi gestionează interfaţa grafică a unei aplica¬ 
ţii. Conţine bucla principală de evenimente a aplicaţiei, în care sunt proce¬ 
sate evenimentele provenind de la sistemul de ferestre. De asemenea ges¬ 
tionează configurările aplicaţiei, fazele de iniţializare şi terminare a aplicaţiei. 

Orice aplicaţie Qt este un obiect QApplication indiferent de numărul de 
ferestre ale aplicaţiei. Obiectul este accesibil prin apelarea funcţiei membre 
instanceO, care returnează un pointer către acest obiect. 

1.2 Clasa Qlmage 

Clasa Qlmage pune la dispoziţie o reprezentare independentă de platformă 
a unei imagini, care permite accesul direct la valorile pixelilor. Qt oferă 
patru clase pentru manipularea imaginilor: Qlmage, QPixmap, QBitmap şi 
QPicture. 

Clasa Qlmage este proiectată şi optimizată pentru operaţii de intrare/ieşi- 
re şi pentru acces direct la pixelii imaginii, pe când clasa QPixmap este proiec¬ 
tată şi optimizată pentru vizualizarea imaginilor pe ecran. Clasa QBitmap 

1 Trolltech, http:// www.trolltech.com 

2 Application Program Interface. 

3 Limbaj de grafică 3D dezvoltat de firma Silicon Graphics. 
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moşteneşte clasa Pixmap şi este folosită pentru imagini binare, iar clasa 
QPicture este un “paint device”. In continuare ne vom concentra atenţia 
asupra clasei Qlmage. 

Clasa Qlmage poate manipula o serie de formate de imagine, care includ 
fie imagini monocrome, fie reprezentate pe 8 biţi sau 32 biţi. Clasa pune 
la dispoziţie o colecţie de funcţii care pot fi folosite pentru obţinerea de 
informaţii despre imagine sau care permit anumite transformări ale imaginii. 

1.2.1 Manipularea imaginilor 

Clasa Qlmage oferă câteva moduri de a încărca o imagine dintr-un fişier: la 
instanţierea obiectului Qlmage sau folosind funcţiile loadFromDataO sau 
loadO, care vor fi apelate după crearea obiectului Qlmage. Pentru a salva 
un obiect de tip Qlmage se foloseşte funcţia save(). 

Următorul exemplu ilustrează folosirea funcţiei load(): 

Qlmage image; 

QString filename = QFileDialog :: getOpenFileName(); 

image.load( filename, 0 ); 

Lista completă a formatelor de fişiere cunoscute este disponibilă prin 
intermediul a două metode: QlmageReader: : supportedlmageFormats () şi 
QlmageWriter: : supportedlmageFormats (). Implicit, Qt suportă următoa¬ 
rele formate de fişiere: 


Format 

Descriere 

Operaţii 

BMP 

Windows Bitrnap 

Read/Write 

GIF 

Graphic Interchange Format (opţional) 

Read 

JPG 

Joint Photographic Experts Group 

Read/Write 

JPEG 

Joint Photographic Experts Group 

Read/Write 

PNG 

Portable Network Graphics 

Read/Write 

PBM 

Portable Bitrnap 

Read 

PGM 

Portable Graymap 

Read 

PPM 

Portable Pixmap 

Read/Write 

XBM 

XII Bitrnap 

Read/Write 

XPM 

XII Pixmap 

Read/Write 


Tabelul 1.1: Formate de fişiere imagine suportate de Qt. 

1.2.2 Atribute ale imaginii 

Qlmage oferă o colecţie de funcţii pentru obţinerea de informaţii despre 
atributele imaginii, cum ar fi geometria imaginii sau informaţii despre paleta 
de culori. 
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Atribute 

Funcţii 

Geometrie 

Funcţiile size(), width(), heightO, 
dotsPerMeterXO şi dotsPerMeterYO 
oferă informaţii despre dimensiunile şi as¬ 
pectul imaginii. 

Culoare 

Culoarea unui pixel poate fi aflată spe¬ 
cificând coordonatele pixelului funcţiei 
pixel (), care returnează culoarea ca 
o valoare QRbg. In cazul imagini¬ 

lor monocrome sau cu nivele de gri, 
funcţiile numColorsO şi colorTable 
oferă informaţii despre componentele de 
culoare ale imaginii. 

Nivel jos 

Funcţia depth() returnează numărul de 
biţi pe care este reprezentată valoarea 
unui pixel: 1 (imagini monocrome), 8 sau 
32. Funcţiile format(), bytesPerLine() 
şi numBytesO oferă informaţii despre 
modul de stocare a imaginii. 


Tabelul 1.2: Funcţii de aflare a atributelor unei imagini. 

1.2.3 Manipularea pixelilor 

In cazul în care culorile pixelilor sunt stocate pe 32 biţi, funcţia setPixel 
se poate utiliza pentru modificarea valorii unui pixel specificat prin coor¬ 
donatele sale. Noua sa valoare este un cvadruplu ARGB 4 , fiind unul din 
argumentele funcţiei. Pentru a specifica valoarea unui pixel în modelul RGB 
se foloseşte funcţia qRgb care returnează un obiect QRgb. 

In continuare este prezentat un exemplu de folosire a funcţiei setPixel. 
Se crează mai întâi un obiect Qlmage, reprezentând o imagine de dimensiune 
3x3. 

Qlmage image(3, 3, Qlmage::Format_RGB32); 

QRgb value; 

value = qRgb(189, 149, 39); // 0xffbd9527 
image.setPixel(1, 1, value); 

value = qRgb(122, 163, 39); // 0xff7aa327 
image.setPixel(0, 1, value); 
image.setPixel(1, 0, value); 

4 Alpha Red Green Blue. 
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value = qRgb(237, 187, 51); // 0xffedba31 
image.setPixel(2, 1, value); 

1.2.4 Formate de imagine 

Fiecare pixel stocat într-un obiect de tip QImage este reprezentat ca un 
întreg. Dimensiunea acestui întreg depinde de format. Qt suportă imagini 
monocrome, reprezentate pe 1 bit şi imagini reprezentate pe 8 sau 32 biţi. 

Imaginile monocrome sunt stocate folosind indici de 1 bit într-o tabelă 
de culoare cu doar două intrări (culori). In funcţie de ordinea de stocare 
a biţilor, big endian sau little endian, diferenţiem două tipuri de imagini 
monocrome. 

Imaginile reprezentate pe 8 biţi sunt stocate folosind indici de 8 biţi 
într-o tabelă de culoare, având un byte per pixel. Tabela de culoare este un 
obiect QVector<QRgb>. 

Imaginile reprezentate pe 32 biţi nu au tabelă de culoare, fiecare pixel 
conţinând o valoare QRgb. Cea mai răspândită modalitate de a reprezenta 
tripletul RGB pe 32 biţi este următoarea: OxffRRGGBB, în care se folosesc 
câte 8 biţi pentru fiecare componentă. 

Formatul unei imagini se poate determina folosind funcţia format(). 
Pentru a converti o imagine într-un nou format se foloseşte funcţia 
convertToFormat (), care acceptă ca argument noul format al imaginii. 
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Noţiuni introductive de 
prelucrarea imaginilor 

BREVIAR TEORETIC 

2.1 Percepţia imaginilor 

înţelegerea procesului de percepţie a imaginilor de către ochiul uman este 
foarte importantă pentru dezvoltarea de tehnici de evaluare a calităţii unui 
sistem sau algoritm de procesare a imaginilor. Informaţia la nivel vizual, 
conţinută de către o imagine, reprezintă o distribuţie spaţială a unei anumite 
mărimi, cum ar fi de exemplu luminanţa obiectelor ce compun respectiva 
imagine. Informaţia percepută de ochiul uman poate fi definită de atribute 
cum ar fi strălucirea, culoarea sau muchiile unui obiect. 

2.1.1 Structura ochiului uman. Formarea imaginii 

Ochiul uman are o formă aproape sferică, având un diametru, în medie, 
de aproximativ 2 cm. Este format din mai multe membrane: corneea şi 
sclerotica, ca înveliş exterior, şi coroida şi retina în interior. Corneea este un 
ţesut dur şi transparent, pe când sclerotica este o ţesut opac. Coroida se află 
imediat sub sclerotică şi conţine o reţea de vase de sânge, ce hrănesc ochiul. 
Este puternic pigmentată pentru a reduce excedentul de lumină ce intră în 
ochi. Pe cea mai din interior membrană, retina, se formează imaginea, sub 
influenţa luminii reflectate de obiectele exterioare ochiului. 

Retina conţine două tipuri de receptori: conuri şi bastonaşe. Conurile, 
în număr de aproximativ 6-7 milioane, servesc la percepţia culorilor. Ve¬ 
derea umană poate percepe detalii foarte fine datorită densităţii mari a aces¬ 
tor receptori, fiecare con fiind legat la o terminaţie nervoasă. Bastonaşele, 
în număr de aproximativ 75-150 milioane, servesc vederii crepusculare, în 
condiţii de iluminare slabă. Acestea sunt răspândite pe o arie mare şi conec- 
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tate la doar câteva terminaţii nervoase, ceea ce are ca efect reducerea con¬ 
siderabilă a perceperii detaliilor din imagine. 

Cristalinul joacă rolul de lentilă. El conţine aproximativ 70% apă şi, prin 
compoziţia lui, permite trecerea a doar 8% din spectrul de radiaţie vizibilă, 
absorbind în bună măsură şi radiaţiile infraroşii şi ultraviolete. 

Imaginea obiectelor se proiectează pe retină, prin cristalin, fiind răsturna¬ 
tă şi având dimensiuni mult mai mici, principiu ce stă la baza aparatului de 
fotografiat (vezi Figura 2.1). 



Figura 2.1: Formarea imaginii în aparatul de fotografiat: l-lentilă, 2-camera 
obscură, 3-obiectiv, 4-peliculă. 


2.1.2 Lumina. Luminanţa. Strălucirea 

Lumina este o radiaţie electromagnetică ce stimulează receptorii de la nivelul 
retinei. Ea se exprimă ca fiind o distribuţie L( A) de energie, unde A este 
lungimea de undă a radiaţiei, în cazul nostru vizibilă, cu valori între 350 şi 
780 nm. Lumina percepută de la un obiect se poate scrie matematic astfel: 

/(A) = p(X)L(X) (2.1) 

unde p{ A) reprezintă măsura în care un obiect reflectă sau transmite 
energia luminoasă incidenţă, a cărei distribuţie este exprimată prin L( A). 

Luminanţa sau intensitatea luminoasă a unui obiect cu o distribuţie 
spaţială a luminii, I(x, y,X), se defineşte astfel: 

OO 

f(x,y) = jl(x,y,X)V(X)dX (2.2) 

o 

nnde V (A) este funcţia de eficienţă luminoasă relativă a sistemului vizual. 
Pentru ochiul uman, V (A) este o curbă de tip clopot, a cărei caracteristici 
depind de la o persoană la alta (vezi Figura 2.2). 
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Funcţia de eficienta luminoasa relativa 



lambda (nm) 


Figura 2.2: Forma tipică a funcţiei de eficienţă luminoasă relativă. 


Luminanţa unui obiect este independentă de luminanţa obiectelor din 

jur. 

Strălucirea unui obiect este luminanţa percepută şi depinde de luminanţa 
mediului ambiant obiectului. Două obiecte aflate într-un acelaşi ambient pot 
avea aceeaşi luminanţă, dar străluciri diferite. 

2.2 Modelul matematic al imaginii 

2.2.1 Modelul continuu al imaginii 

Matematic imaginile pot fi reprezentate ca o funcţie de două variabile, în 
spaţiul L 2 (R 2 ), astfel: 

• imaginile în tonuri de gri se pot modela cu: f(x, y ) : R 2 —► R, caz 
în care valorile funcţiei / reprezintă valorile luminanţei obiectelor din 
imagine, în punctele (x, y) ale spaţiului. 

• imaginile color se pot modela cu: f(x,y ) : R 2 —> f? 3 , caz în care 
valorile funcţiei / reprezintă vectori de 3 componente dintr-un spaţiu 
al culorilor. De exemplu pot fi cele trei componente ale modelului 
RGB 1 . 

Spaţiul L 2 (R 2 ) poate fi limitat la un domeniu finit D, ca în Figura 2.3. 


1 RGB = (engl.) Red Green Blue. 
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D 






Figura 2.3: Domeniu finit din R 2 . 

2.2.2 Modelul discret al imaginii 

Acesta este modelul utilizat în practică. Funcţia / ia valori discrete, fiind 
deasemenea definită pe un domeniu de valori discrete, adică: 

f{k,l) : Z 2 Z + sau f(k,l ) : Z 2 -»• Z+ 3 (2.3) 

Trecerea de la domeniul continuu la domeniul discret se face prin eşantio¬ 
nare şi cuantizare. 

2.3 Eşantionarea imaginilor 

Pentru a putea prelucra cu ajutorul unui calculator o imagine f(x, y ), aceasta 
trebuie discretizată spaţial şi în amplitudine. Discretizarea coordonatelor 
spaţiale (x, y) poartă numele de eşantionare. 

Eşantionarea reprezintă procesul de aproximare a unei imagini continue 
f(x,y) cu o matrice de dimensiune MxN, astfel: 


f{x,y ) 


( /(o,o) 

/(o,i) 

... /(0, M — 1) 

\ 


/(1,0) 

/(1,1) 

... — 1) 


(2.4) 

V f(N- 1,0) 

m- i,i) 

... f(N — 1, M - 

1) ) 


eşantionării: 

O imagine 

f(x,y), având un 

spectru finit, 


eşantionată uniform cu o reţea dreptunghiulară de forma celei din Figura 
2.4 poate fi refăcută fără eroare din eşantioanele f(mSx,nSy) cu ajutorul 
formulei de interpolare: 


OO 

f{x,y) = 


OO 

^ f(mSx,n6y ) 


simr(xu s — m)\ ( simt{xv s — n ) 
ir(xv s — n) 


m =—oo n =—oo 


7 t(xu s — m) 


(2.5) 
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unde u s şi v s reprezintă frecvenţele spaţiale de eşantionare. 

Egalitatea dată de teorema eşantionării este valabilă dacă şi numai dacă 
este respectată condiţia Nyquist, şi anume: 

1 1 . . 

— =u s > 2 u 0 , — = v s > 2vq (2.6) 

ox oy 

unde uq şi vq reprezintă frecvenţele spaţiale maxime care apar în imagine. 


n 


dx 


O O O <j> <p o o -o 

oooooooo 
o o o o o o o -00- 

O O O O O o o —e- 


dy 


OffiOOOOOO 


-e—©—e—e—0—0—0—00 


OffiOOOOOO 


m 


Figura 2.4: Reţea dreptunghiulară de eşantionare. 

Cu alte cuvinte, frecvenţele spaţiale de eşantionare trebuie să fie cel puţin 
dublul frecvenţelor spaţiale maxime conţinute de imagine. 


2.4 Cuantizarea imaginilor 

Cuantizarea este procesul de discretizare a valorilor funcţiei f(x, y ). Aceasta 
se realizează de obicei cu ajutorul unei funcţii de tip scară, de forma celei 
din Figura 2.5. 

Astfel, tuturor valorilor lui x dintr-un interval li se atribuite valori dis¬ 
crete k. Cuantizarea este un proces însoţit de zgomot, cunoscut sub numele 
de eroare de cuantizare. Cea mai utilizată metodă de cuantizare este cea 
uniformă, ceea ce înseamnă că intervalele funcţiei de cuantizare sunt egale. 


2.5 Imaginile digitale 

Imaginile astfel discretizate reprezintă structuri bidimensionale de date, de¬ 
numite imagini digitale. Un element (k, l ) al imaginii poartă numele de 
pixeP. 

2 pixel = (engl. picture + element). 
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Figura 2.5: Exemplu de funţie de cuantizare. 

Imaginile digitale pot fi stocate în memoria sau pe discul unui sistem 
de procesare şi analiză a imaginilor, în vederea vizualizării sau prelucrării 
ulterioare. Pe disc imaginile sunt stocate sub forma unor fişiere. Fişierele 
pot fi de mai multe feluri, în funcţie de formatul în care păstrează datele ce 
reprezintă imagini: BMP, JPEG, GIF, TIFF, etc. 

Cel mai simplu format de fişier imagine este Windows Bitmap (BMP) 
al firmei Microsoft. Acesta este formatul în care o imagine digitală este 
stocată practic fără nici un fel de codare sau pierdere de informaţie, cu 
excepţia reprezentării binare. 


DESFĂŞURAREA LUCRĂRII 

In continuare este prezentat codul C++ al unei aplicaţi care citeşte o imag¬ 
ine în format BMP şi o afişează într-o fereastră pe ecran. Aplicaţia este 
dezvoltată utilizând bibliotecile Qt (Linux). Citiţi şi înţelegeţi codul. 
Fişierul aplicatie.h conţine declararea clasei ImageViewer. 

#ifndef APLICATIE_H 
#define APLICATIE_H 

#include <qwidget.h> 

#include <qimage.h> 

#include <qpainter.h> 

#include <qlabel.h> 

class QMenuBar; 
class QPopupMenu; 


class ImageViewer : public QWidget 
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Q_OBJECT 
public: 

ImageViewer( QWidget aparent = O, const char *name = 0, 
int wFlags = 0 ); 

"ImageViewer(); 

bool loadImage( const char *fileName ); 
protected: 

void paintEvent( QPaintEvent * ); 


private: 
int 
int 

Qlmage 

QPixmap 

QMenuBar 


conversion_flags; 
alloc_context; 
image; 
pm; 

*menubar; 
QPopupMenu *file; 

QLabel *status; 

bool reconvertlmage(); 


private slots: 

void openFile( void ); 
void saveFile( void ); 


#endif // APLICATIE_H 

Fişierul aplicaţie. cpp conţine definiţiile funcţiilor membre clasei Im¬ 
ageViewer. 

#include "aplicaţie.h" 

#include <qmenubar.h> 

#include <qfiledialog.h> 

#include <qmessagebox.h> 

#include <qpopupmenu.h> 

#include <qpainter.h> 

#include <qapplication.h> 

#include <qwidget.h> 

ImageViewer :: ImageViewer( QWidget Aparent, const char *name, 
int wFlags ) : QWidget( parent , name , wFlags ), 
conversion_flags( PreferDither ), filenameţ 0 ) 

{ 


alloc_context = 0; 
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menubar = new QMenuBar( this ); 

menubar->setSeparator( QMenuBar :: InWindowsStyle ); 

file = new QPopupMenuQ ; 

CHECK_PTR( file ); 

menubar->insertltem( "&File" , file ); 
file->insertltem( "Open image ( BMP )", this, 

SLOT( openFile() ), CTRL+Key_0 ); 
file->insertSeparator(); 

file->insertltem( "Save as ... ( BMP )", this, 

SLOT( saveFile() ), CTRL+Key_S ); 
file->insertSeparator(); 

file->insertltem( "Quit", qApp, SL0T(quit()), CTRL+Key_Q ); 
status = new QLabel( this ); 

status->setFrameStyle( QFrame::WinPanel | QFrame::Sunken ); 
status->setFixedHeight( fontMetrics().heightO + 4 ); 

setMouseTracking( TRUE ); 

> 

ImageViewer :: ~ImageViewer() 

{ 

if ( alloc_context ) 

QColor :: destroyAllocContext( alloc_context ); 

delete menubar; 
delete file; 
delete help; 
delete status; 

> 

void ImageViewer :: openFile() 

{ 

QString newfilename = QFileDialog :: getOpenFileName(); 

if ( !newfilename.isEmpty() ) 

{ 

loadImage( newfilename ); 
repaint(); 

> 

> 


void ImageViewer :: saveFile( void ) 
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QlmagelO iio; 

QString save_as_file = QFileDialog :: getSaveFileName(); 

if ( ! save_as_f ile. isEmptyO ) 

{ 

iio.setlmage( image ); 

iio.setFileName( save_as_file ); 

iio.setFormat( "BMP" ); 

iio.write(); 

> 


bool ImageViewer :: loadImage( const char *fileName ) 

{ 

bool ok = FALSE; 
int w, h; 

if( filename ) 

{ 

QApplication :: setOverrideCursor( waitCursor ); 

ok = image.load( filename , 0 ); 

pm.convertFromlmage( image , conversion_flags ); 

if( ok ) 

{ 

setCaptionC filename ); 
w = pm.width(); 
h = pm.height(); 

h += menubar->heightForWidth(w) + status->height(); 

> 

else 

{ 

pm.resize( 0,0); 
updateQ ; 

> 

setFixedWidth( w ); 
setFixedHeight( h ); 

status->setGeometry( 0, heightO - status->height(), 
width(), status->height() ); 

QApplication :: restoreOverrideCursor(); 

> 

return ok; 
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void ImageViewer :: paintEvent( QPaintEvent *e ) 

{ 

if ( pm.sizeO != QSize( 0, 0 ) ) 

{ 

QPainter painter( this ); 
painter.setClipRect( e->rect() ); 
painter.drawPixmap( 0, menubar->heightForWidth( 
width() ), pm ); 

> 

> 


Fişierul main.cpp conţine instanţierea unui obiect QApplication şi a 
unuia de tip ImageViewer. 

#include "aplicaţie.h" 

#include <qapplication.h> 

#include <qimage.h> 

#ifdef QIMGIO 
#include <qimageio.h> 

#endif 

int main( int argc, char **argv ) 

{ 

QApplication :: setFont( QFont( "Helvetica" , 12 ) ); 
QApplication a( argc, argv ); 

#ifdef QIMGIO 

qlnitlmagelO(); 

#endif 

ImageViewer *w = new ImageViewer( 0, "main window", 

QWidget :: WDestructiveClose ) ; 
w->show() ; 

QObject :: connect( qApp, SIGNAL( lastWindowClosedO ), 
qApp, SLOT (quitO) ); 
return a.execQ ; 

> 



Lucrarea 3 


îmbunătăţirea imaginilor 
prin operaţii punctuale 

BREVIAR TEORETIC 

Termenul general de îmbunătăţire a imaginilor se referă la o clasă largă 
de operaţii, ce au ca scop mărirea detectabilităţii componentelor imaginii. 
Această detectabilitate depinde în primul rând de percepţia vizuală a unui 
observator uman şi deci reprezintă o apreciere subiectivă a imaginii. 

îmbunătăţirea calităţii unei imagini se face fără a presupune vreun model 
de degradare sau a lua în considerare vreo informaţie legată de imaginea 
originală. Paradoxal, dar şi o imagine originală (nedegradată) poate fi 
îmbunătăţită. 

In general, îmbunătăţirea se referă la accentuarea unor caracteristici 
ale imaginii, cum ar fi muchiile, contururile sau contrastul. Procesul de 
îmbunătăţire nu măreşte cantitatea de informaţie conţinută de o imagine. 


3.1 Operaţiile punctuale 

Operaţiile punctuale sunt definite de o funcţie, care atribuie un nou nivel 
de gri pixelilor din imagine. Noua valoare a pixelului va depinde doar de 
vechea valoare a acestuia, de unde şi denumirea de “operaţie punctuală”. 
Matematic se poate scrie: 


g(k, l) = l)) (3.1) 

unde / este imaginea originală, iar g imaginea îmbunătăţită. g(k. I ) 
reprezintă noua valoare a pixelului (k, l), iar f(k, l ) vechea valoare. Operaţia 
punctuală este descrisă de funcţia (f>. 

O operaţie sau o transformare punctuală este reprezentată în Figura 3.1. 
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Figura 3.1: Reprezentarea unei operaţii punctuale. 


3.2 Accentuarea contrastului 

Această operaţie se foloseşte în special pentru îmbunătăţirea imaginilor cu 
contrast scăzut. Acesta poate apărea datorită unei slabe iluminări, a unei 
iluminări neuniforme sau din cauza unor neliniarităţi ale caracteristicilor 
unui senzor de captură a imaginii. O funcţie tipică de accentuare a con¬ 
trastului are următoarea formă matematică: 


1 

1 ax, 

pentru 

x e [ 0 , a) 


(j)(x) = l 

(3(x -a) + v a , 

{ 7 (x - b) + v b , 

pentru 

pentru 

x e [a, b ) 
x e [b, L) 

(3.2) 


unde L reprezintă numărul de nivele pe care se face cuantizarea tonurilor 
de gri. Cazul cel mai frecvent este L = 256, pentru o cuantizare pe 8 biţi, x 
luând valori în intervalul [0,255]. Valorile a,/3 şi 7 reprezintă pantele celor 
trei segmente de dreaptă. 



Figura 3.2: Funcţia de accentuare de contrast. 

După cum se observă din Figura 3.2, pantele a şi 7 sunt pozitive şi 
subunitare, iar panta /3 este pozitivă şi supraunitară. Un segment cu pantă 
subunitară realizează o “apropiere” a nivelelor de gri, pe când un segment 
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cu pantă supraunitară va realiza o “depărtare” a nivelelor de gri, şi deci o 
accentuare a contrastului. 


3.3 întinderea maximă a contrastului 


Aceasta este un caz particular al operaţiei de accentuare. Se foloseşte, în 
general, pentru reducerea zgomotului dintr-o imagine, atunci când se ştie 
că acesta ia valori cu precădere în intervalul [a,b\. Forma matematică este 
următoarea: 




0, pentru x £ [0, a) 

(3{x — a), pentru x £ [a, b] 

L — 1, pentru x £ (6, L) 


(3.3) 


Nivelele de gri aflate în intervalul [a, b\ vor fi distanţate, ca urmare a 
pantei supraunitare, iar nivelele de gri ce se găsesc în afara acestui interval, 
vor fi înlocuite fie cu alb, fie cu negru, după caz. 



Figura 3.3: Funcţia de întindere maximă a contrastului. 
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Figura 3.4: întinderea maxima a contrastului: (a) imaginea originală şi (b) 
imaginea rezultată, pentru a=50, b=200. 


3.4 Binarizarea imaginilor 

Binarizarea sau prăguirea (“thresholding”) imaginilor este un caz special al 
întinderii maxime a contrastului, pentru care a = b. Rezultatul operaţiei de 
binarizare este o imagine care conţine doar două nivele de gri: alb şi negru. 

Pentru imagini în tonuri de gri, operaţia de binarizare se scrie matematic 
astfel: 


J 0, pentru x < T 
\ L — 1, pentru x > T 


(3.4) 


unde T este o valoare de prag, reprezentând o valoare întreagă din in¬ 
tervalul [0, L). 

Pentru imaginile color, binarizarea se poate face în următorul mod: 


J 0, pentru Y(v) <T 
\ L — 1, pentru Y(v) >T 


(3.5) 


unde v este un vector tridimensional ce reprezintă culoarea pixelului (de 
exemplu v = ( R,G,B ) ), iar Y(v) reprezintă luminanţa (Y = 0.3R +0.6G + 
0.1 B ). 

In urma acestei transformări, contrastul este maximizat la nivelul întregii 
imagini. 


3.5. NEGATIVAREA IMAGINILOR 
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0(X) 

L-l 

O T L-l x 

Figura 3.5: Funcţia de binarizare. 


(b) 

Figura 3.6: Binarizarea: (a) imaginea originală şi (b) imaginea binarizată 
cu T=127. 

3.5 Negativarea imaginilor 

Negativul unei imagini se obţine prin inversarea ordinii nivelelor de gri. 
Pentru imaginile în tonuri de gri, operaţia de negativare se face folosind 
funcţia: 

4>(x) = (L — 1) — x (3.6) 

reprezentată în Figura 3.7, iar pentru imaginile color: 





<P(v) = ((L - 1) - R, (L - 1) - G, (L-l)- B) 


(3.7) 
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Figura 3.7: Funcţia de negativare. 


Negativarea imaginilor este utilă pentru afişarea unor imagini medicale 
sau pentru realizarea de imagini negative pe suporturi fizice, de exemplu, 
de tip peliculă. 



Figura 3.8: Negativarea: (a) imaginea originală şi (b) negativul imaginii. 


3.6 Decuparea imaginilor 

Decuparea cu păstrarea fundalului este dată de formula: 


<f>(x ) 


L — 1, pentru x e [a, b] 
x , în rest. 


(3.8) 


iar decuparea fără păstrarea fundalului este dată de formula: 
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L — 1, pentru x £ [a, 6] 
O, m rest. 


(3.9) 



Figura 3.9: Funcţia de decupare cu păstrarea fundalului. 


0(X) 

L-l 


O a b L-l X 


Figura 3.10: Funcţia de decupare fără păstrarea fundalului. 

Aceste operaţii permit “decuparea” unor regiuni din imagine, caracte¬ 
rizate de anumite nivele de gri. Acest lucru este folosit atunci când diferite 
carcaterisitici ale imaginii sînt conţinute în nivelele de gri respective, cum 
ar fi de exemplu decuparea regiunilor de temperatură joasă reprezentate 
de nori din imaginile obţinute de un satelit meteo. In astfel de imagini, 
nivelele de gri ce corespund unor nori sînt direct proporţionale cu valorile 
de temperaturi joase. 

DESFĂŞURAREA LUCRĂRII 

Problema 1 . Compilaţi sursele C+-H ale lucrării. Rulaţi aplicaţia şi 
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observaţi rezultatul accentuării contrastului pentru o imagine în tonuri de 
gri (lena_AN.bmp). Funcţia care realizează accentuarea contrastului este 
prezentată în continuare, pentru următoarele valori: a = 80, b = 170, 
V a = 20 şi V b = 235. 


Pantele care caracterizează funcţia de accentuare a contrastului vor fi 

următoarele- o - ^0 - ni R- 235-20 _ 215 ţ _ 255-235 _ 20 

următoarele, a g0 U.4, p 170-so 90 T 255-170 85' 


int ImageViewer :: f_accentuare( int nivel_gri ) 

{ 

if( nivel_gri >= 0 && nivel_gri <= 80 ) 
return ( int )( 0.4 * nivel_gri ); 

if( nivel_gri > 80 && nivel_gri <= 170 ) 

return ( int )( 215 / 90. * ( nivel_gri - 80 ) + 20 ); 

if( nivel_gri > 170 && nivel_gri <= 255 ) 

return ( int )( 20 / 85. * ( nivel_gri - 170 ) + 235 ); 

return nivel_gri; 

> 

void ImageViewer :: accentueaza_contrastul( void ) 

{ 

int w, h; 
int i, j ; 

w = image.width(); 
h = image.height(); 

Qlmage imag_acc( w, h, 32, 0, Qlmage :: IgnoreEndian ); 

for( i = 0; i < w; i++ ) 
for( j = 0; j < h; j++ ) 

{ 

QRgb pixel = image.pixel( i, j ); 
int gri_vechi = qRed( pixel ); 
int gri_nou = f_accentuare( gri_vechi ); 
imag_acc.setPixelţ i, j, 

qRgb( gri_nou, gri_nou, gri_nou ) ); 

> 

QlmagelO iio; 

iio.setlmage( imag_acc ); 
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iio.setFileName( "imag_acc.bmp" ); 
iio.setFormat( "BMP" ); 
iio.write(); 


Problema 2. Modificaţi valorile a, b, V a şi H ale funcţiei de accentuare 
a contrastului, şi observaţi rezultatele accentuării contrastului. 

Problema 3. Implementaţi operaţia de întindere maximă a contrastu¬ 
lui. 

Problema 4. Implementaţi operaţia de binarizare. Observaţi rezul¬ 
tatele acesteia pentru diferite valori ale pragului T. 

Problema 5. Observaţi rezultatul operaţiei de negativare, pentru o 
imagine în tonuri de gri şi pentru o imagine color. 

void ImageViewer :: negativeaza_imaginea( void ) 

{ 

int w, h; 
int i, j ; 

w = image. widthQ ; 
h = image.height(); 

Qlmage imag_neg( w, h, 32, 0, Qlmage :: IgnoreEndian ); 

for( i = 0; i < w; i++ ) 
for( j = 0; j < h; j++ ) 

{ 

QRgb pixel = image.pixel( i, j ); 
int r = qRed( pixel ); 
int g = qGreen( pixel ); 
int b = qBlue( pixel ); 

imag_neg.setPixel( i, j, qRgb(255-r, 255-g, 255-b) ); 

> 

QlmagelO iio; 

iio.setlmage( imag_neg ); 

iio.setFileName( "imag_neg.bmp" ); 

iio.setFormat( "BMP" ); 

iio.writeQ ; 


Problema 6. Implementaţi cele două operaţii de decupare. 



LUCRAREA 3. ÎMBUNĂTĂŢIREA IMAGINILOR 



Lucrarea 4 


îmbunătăţirea imaginilor 
prin egalizarea histogramei 


BREVIAR TEORETIC 

Tehnicile de îmbunătăţire a imaginilor bazate pe calculul histogramei modifi¬ 
că histograma astfel încât aceasta să aibă o anumită formă dorită. 


4.1 Histograma unei imagini 


Histograma unei imagini reprezintă frecvenţa relativă de apariţie a nivelelor 
de gri din imagine. Pentru o imagine /, de dimensiune M x N pixeli, 
histograma se defineşte astfel: 


M-1N-1 

K 1 ) = Jjjj Y Y ’ * = 0,.., L - 1 

m= 0 n =0 

unde funcţia 5 este definită în următorul mod: 


(4.1) 


( 1, dacă x = y, 
\ 0, dacă x / y. 


(4.2) 


Din punct de vedere statistic, putem considera valoarea fiecărui pixel al 
imaginii ca o realizare particulară a unei variabile aleatoare asociată nivelelor 
de gri, caz în care histograma reprezintă funcţia de densitate de probabilitate 
a acestei variabile aleatoare. Fiind o funcţie de densitate de probabilitate, 
histograma oricărei imagini verifică condiţia de normare: 


L-l 


Y w) = 1 


(4.3) 


i =0 


Practic, calculul histogramei presupune parcurgerea pixel cu pixel a 
imaginii şi contorizarea numărului de nivele de gri întâlnite. 
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4.2 Egalizarea histogramei 

Egalizarea histogramei reprezintă o operaţie de accentuare a contrastului şi 
are ca scop obţinerea unei histograme uniforme. 

Vom asocia unui pixel din imagine o variabilă aleatoare £. Astfel, va¬ 
lorile intensităţii luminoase ale pixelilor reprezintă realizări particulare ale 
variabilei aleatoare asociate. Vom considera că variabila aleatoare £ are o 
densitate de probabilitate wţ(x) şi o funcţie de repartiţie Fş(x) = P{ţ < x}. 

Vom defini în continuare variabila rj, care are funcţia de repartiţie: 

X 

Fr,( x) = J Pţ(t)dt 
o 

şi care va fi uniform distribuită în intervalul (0,1). 

Pentru cazul discret, presupunem că nivelele x de gri ale pixelilor au va¬ 
lori între 0 şi L —1 (unde L este de regulă 256), având asociate probabilităţile 
de apariţie pţ(xi), unde Xi = 0,1,... ,L — 1. Aceste probabilităţi pot fi 
estimate pe baza calculului histogramei, considerând imaginea dată, ca fiind 
o realizare particulară a procesului aleator descris de variabila aleatoare £, 
astfel: 


Pţ( x i) 


h{xj) 

E K x i) 

i =0 


Noile nivele de gri, reprezentând valori discrete ale variabilei r/ din inter¬ 
valul [0, L — 1] se vor calcula cu formulele: 


X 

hc(x ) = ^2 p d x i) 
Xi =0 


nivelnrm = int 


h c \nivel vec hi\ h c 

1 formim 


'-(L - 1) + 0.5 


unde h c reprezintă histograma cumulativă a imaginii, iar h crnin este va¬ 
loarea minimă a histogramei cumulative. 


4.2.1 Algoritmul de egalizare a histogramei 

Algoritmul de egalizare de histogramă, folosit în practică, poate £ descris în 
limbaj pseudocod astfel: 

Pasul 1. Se calculează histograma imaginii: 

pentru i = 1,..,L 
h[i] = 0 

pentru i = 1,..,M 

pentru j = lj-jN 
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nivel = imagine [i,j] 
h [nivel] = h [nivel] + 1 

unde L este numărul de nivele de gri (256), h este histograma imaginii, iar 
M şi N sunt dimensiunile imaginii. 

Pasul 2. Se calculează histograma cumulativă a imaginii: 
hc[l] = h[l] 
pentru i = 2,..,L 

hc[i] = hc[i-l] + h[i] 


Pasul 3. Se calculează noile nivele de gri din imagine, sub forma unei 
transformări y = T(x) dată de formula: 


V = T{x) 


hc[x\ — hc[ 1] 
NM - hc[ 1] 


(L- 1) + 0.5 


astfel: 


pentru i = 1,..,M 

pentru j = 1,-,N 


niveLvechi = imagine [i,j] 
niveLnou = T(niveLvechi) 
imagine[i,j] = nivel_nou 


4.3 Observaţii 


• Deşi la prima vedere egalizarea de histogramă ar părea că este o 
operaţie punctuală, din cauza formulei de calcul a noilor valori de 
gri, ea este totuşi o operaţie integrală, datorită faptului că pentru 
fiecare pixel din imagine noua valoare se calculează pe baza calculului 
histogramei şi, deci, pe baza valorilor tuturor pixelilor din imagine. 


• In Figura 4.1 puteţi observa cum imaginea a fost îmbunătăţită prin 
egalizarea histogramei. 


• In Figura 4.2 puteţi observa cum s-a modificat forma histogramei ima¬ 
ginii originale, după egalizare. 
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DESFĂŞURAREA LUCRĂRII 

O posibilă implementare a algoritmului de egalizare a histogramei este prezen¬ 
tat în continuare: 

void ImageViewer :: egalizeaza_histograma( void ) 

{ 

int i, j ; 

int width, height; 
int h[ 256 ] ; 

for( i = 0; i < 256; i++ ) 
h[ i ] =0; 

width = image.width(); 
height = image.height(); 

//calcularea histogramei imaginii 
for( i = 0; i < width; i++ ) 

for( j = 0; j < height; j++ ) 

{ 

QRgb pixel; 

pixel = image.pixel( i, j ); 

int nivel_gri = qRed( pixel ); 
h[ nivel_gri ]++ ; 

> 

//calcularea histogramei cumulative 
double hc[ 256 ]; 

hc [ 0 ] = h[ 0 ]; 

for( i = 1; i < 256; i++ ) 

hc[i] = hc [ i - 1 ] + h[ i ] ; 

Qlmage imag_eq( width, height, 32, 0, Qlmage::IgnoreEndian ) 

//egalizarea histogramei 
for( i = 0; i < width; i++ ) 

for( j = 0; j < height; j++ ) 

{ 

QRgb pixel = image.pixel( i, j ); 


int nivel = qRed( pixel ); 
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int nivel_nou = (int)( ( hc [nivel] - hc [0] ) * 255 / 

( width*height - hc [0] ) ); 

imag_eq.setPixel( i, j, 

qRgb( nivel_nou, nivel_nou, nivel_nou ) ); 

> 

image = imag_eq; 
pm = image; 
updateQ ; 

> 

Problema 1 . Observaţi forma histogramei pentru câteva imagini în 
tonuri de gri. 

Problema 2. Observaţi efectele egalizării de histogramă pentru diferite 
imagini, inclusiv pentru o imagine subexpusă şi pentru una supraexpusă. 

Problema 3. Modificaţi funcţia histograma_imaginii astfel încât 
aceasta să calculeze histograma cumulativă a imaginii. Observaţi forma 
unei histograme cumulative. 

Problema 4. Justificaţi faptul că histograma cumulativă a unei imagini 
poate fi considerată estimatul unei funcţii de repartiţie. 



Lucrarea 5 


Transformări geometrice de 
bază 

BREVIAR TEORETIC 

Transformările geometrice sunt transformări care nu modifică valorile pi- 
xelilor din imagine, ci modifică doar aşezarea lor spaţială. Cu alte cuvinte, 
lasă nemodificată compoziţia imaginii, alterându-i însă structura. In urma 
aplicării unei transformări geometrice asupra unei imagini, histograma aces¬ 
teia nu se modifică. 

5.1 Translaţia 

Translaţia se defineşte ca fiind operaţia de modificare în linie dreaptă a 
coordonatelor unui pixel din imagine de la o poziţie la alta. Un pixel de 
coordonate carteziene (. x,y) va avea după translaţie coordonatele (x ,y), 
astfel: 


r x = x + t x 
l y =v + T y 

unde perechea (T x , T y ) reprezintă vectorul de translaţie (vezi Figura 5.1). 
Translatarea unei imagini se realizează prin translatarea fiecărui pixel 
în parte. Valorile T x şi T y sunt numere întregi pozitive sau negative. In 
cazul în care noile coordonate ale unui pixel depăşesc dimensiunile imaginii, 
atunci el va h poziţionat în partea opusă a imaginii, ca în Figura 5.2. 

5.2 Rotaţia 

Rotaţia se defineşte ca fiind operaţia de modificare după o traiectorie cir¬ 
culară a coordonatelor unui pixel din imagine (vezi Figura 5.3). Rotaţia 
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Figura 5.1: Translatarea unui obiect dreptunghiular. 



Figura 5.2: Translatarea spre dreapta a unui obiect dreptunghiular intr-o 
imagine. 


este specificată de unghiul (f>. Poziţia unui pixel, exprimată în coordonate 
carteziene (x,y), se exprimă în coordonate polare (r, 9) astfel: 


( x = rcosO 
\ y = rsinQ 


(5.2) 


Noile coordonate carteziene ( x',y' ) ale pixelului rotit cu un unghi 4> vor 
fi: 


J x 1 = rcos(6 + (/>) = rcosOcoscj) — rsindsincj) = xcoscj) — ysiruj) 
\ y' = rsin(9 + (/>) = rsinOcoscj) + rcosOsincj) = xsin4> + ycoscj) 





5.3. OGLINDIREA 
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Figura 5.3: Rotaţia. 


5.3 Oglindirea 


Oglindirea este operaţia prin care se produce imaginea în oglinda a unui 
obiect, relativ la o axă de oglindire. In Figura 5.4 sunt ilustrate cele două 
feluri de oglindire: oglindirea “stânga-dreapta” şi cea “sus-jos”. 




(b) 


Figura 5.4: Oglindirea (a) “stânga-dreapta” (b) “sus-jos”. 


Observaţi în Figura 5.5 efectele oglindirii “stânga-dreapta” a imaginii 
Lena, faţă de o axă verticală ce trece prin centrul imaginii. 
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(a) 


(b) 


Figura 5.5: Oglindirea “stânga-dreapta”: (a) imaginea originală; (b) imag¬ 
inea oglindită. 


DESFĂŞURAREA LUCRĂRII 

In continuare este prezentat codul C care implementează translaţia unei 
imagini pe orizontală, cu un deplasament de 100 de pixeli. Citiţi şi înţelegeţi 
codul. 

void ImageViewer :: translateaza_imaginea( void ) 

{ 

int w, h; 
int i, j; 

int iprim, tx = 100; 

w = image,width(); 
h = image.height(); 

Qlmage imag_tx( w, h, 32, 0, Qlmage :: IgnoreEndian ); 

for( i = 0; i < w; i++ ) 
for( j = 0; j < h; j++ ) 

{ 

QRgb pixel = image.pixel( i, j ); 


iprim = i + tx; 
if( iprim >= w ) 
iprim -= w; 
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imag_tx.setPixel( iprim, j, pixel ); 

> 

image = imag_tx; 
pm = image; 
updateQ ; 


Problema 1. Implementaţi operaţia de translaţie, pentru următorii doi 
vectori de translaţie: (0,100) şi (100,100). 

Problema 2. Implementaţi operaţia de oglindire “stânga-dreapta” faţă 
de axa verticală ce trece prin centrul imaginii. 

Problema 3. Implementaţi operaţia de oglindire “sus-jos” faţă de axa 
orizontală ce trece prin centrul imaginii. 
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Lucrarea 6 


Zgomotul în imagini 


BREVIAR TEORETIC 

Zgomotul este un semnal aleator, care afectează informaţia utilă conţinută 
intr-o imagine. El poate apare de-alungul unui lanţ de transmisiune, sau 
prin codarea şi decodarea imaginii, şi reprezintă un element perturbator ne¬ 
dorit. De obicei se încearcă eliminarea lui prin diverse metode de filtrare. 

Zgomotul se poate suprapune informaţiei utile în două moduri: 

• aditiv. In acest caz, zgomotul se numeşte zgomot aditiv şi matematic 
se poate scrie: 

g(x,y) = f(x,y) +n(x,y) (6.1) 

unde f(x,y) este imaginea iniţială, neafectată de zgomot, n(x,y) este 
zgomotul, iar g(x,y) este imaginea afectată de zgomot. 

• multiplicativ. In acest caz zgomotul se numeşte zgomot multiplicativ, 
iar fenomenul de suprapunere al acestuia peste informaţia utilă se scrie 
matematic astfel: 

g(x, y) = f{x, y) ■ n(x , y) (6.2) 

unde f(x,y), n(x,y) şi g{x,y) au aceleaşi semnificaţii ca mai sus. 

In continuare vom trata zgomotul ca fiind aditiv. Modelul de degradare 
a imaginii este reprezentat în figura 6.1. Zgomotul multiplicativ poate fi 
tratat la fel de simplu ca zgomotul aditiv, dacă logaritmăm relaţia (6.2): 


log{g(x , y)) = log{f(x, y) ■ n(x, y)) = log{f(x, y)) + log(n(x, y)) (6.3) 

Cantitativ, se poate aprecia măsura în care zgomotul a afectat informaţia 
utilă, calculând raportul semnal-zgomot 1 : 

X SNR = (engl.) Signal Noise Ratio. 
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f(x,y) 


n(x,y) 



g(x,y) 


Figura 6.1: Modelul aditiv de degradare. 


M—l N-l 

E E f 2 {hj) 

SNR = 10 logi^k^ - m (6.4) 

E E n 2 (i,j) 


M—l N-l 

E E f 2 {hj) 

SNR = 10 log - ^ J ~° - [dB\ (6.5) 

E E L f(iJ)-g(iJ)} 2 

i=0 j =o 

Raportul semnal-zgomot reprezintă raportul dintre energia imaginii ori¬ 
ginale şi energia zgomotului suprapus acesteia. In continuare vom asocia 
valorilor pe care le ia zgomotul o variabilă aleatoare £, care, în funcţie de 
tipul zgomotului, va fi caracterizată de diferite funcţii de densitate de prob¬ 
abilitate. 


6.1 Zgomotul cu distribuţie uniformă 

Zgomotul cu distribuţie uniformă (vezi Figura 6.2) este caracterizat de o 
funcţie de densitate de probabilitate de forma: 


wş(x) 


A, pentru x € [—|] , 
0 , în rest. 


( 6 . 6 ) 


In Figura 6.3 puteţi observa efectele zgomotului cu distribuţie uniformă 
asupra imaginii “Lena”, pentru un raport semnal/zgomot de 5 dB. 




6.2. ZGOMOTUL CU DISTRIBUŢIE GAUSSIANA 
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1 

w(x) 

A 









-] 

c/2 

10 

k/2 

x * 


Figura 6.2: Funcţia de densitate de probabilitate pentru o distribuţie uni¬ 
formă. 




(a) (b) 

Figura 6.3: Zgomotul uniform: (a) imaginea originală; (b) imaginea afectată 
de zgomot uniform, SNR=5 dB. 


6.2 Zgomotul cu distribuţie gaussiană 


Zgomotul gaussian este caracterizat de o funcţie de densitate de probabili¬ 
tate de forma (vezi Figura 6.4): 


wş(x) 


1 o-<n 2 

. e 2 CT -’ 
\Z2na 2 


(6.7) 



40 


LUCRAREA 6. ZGOMOTUL IN IMAGINI 


-6.0 -4.8 -3.6 -2.4 -1.2 0.0 1.2 2.4 3.6 4.8 6.0 


0.3 

0.3 

0.3 

0.2 

0.2 

0.2 

0.1 

0.1 

0.1 

0.0 

0.0 



0.3 

0.3 

0.3 

0.2 

0.2 

0.2 

0.1 

0.1 

0.1 

0.0 

0.0 


-6.0 -4.8 -3.6 -2.4 -1.2 0.0 1.2 2.4 3.6 4.8 6.0 


Figura 6.4: Funcţia de densitate de probabilitate pentru o distribuţie gaus- 
siană. 


Valoarea medie a unei variabilei aleatoare £, cu o distribuţie dată de 
funcţia wş(x) ca în relaţia (6.7), este /r, iar varianţa ei este a 2 . O distribuţie 
gaussiană se mai numeşte şi normală. O distribuţie normală de medie /r şi 
varianţă a 2 se notează cu N(fi,a 2 ). 

In Figura 6.5 puteţi observa efectele zgomotului cu distribuţie gaussiană 
asupra imaginii “Lena”, pentru un raport semnal/zgomot de 5 dB. 



Figura 6.5: Zgomotul Gaussian: (a) imaginea originală; (b) imaginea afec¬ 
tată de zgomot gaussian, SNR=5 dB. 





6.3. ZGOMOTUL DE TIP “SARE ŞI PIPER” 
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6.3 Zgomotul de tip “sare şi piper” 

După cum îi spune numele, acest tip de zgomot va afecta valorile pixelilor 
în două moduri: “sare” - adică noua valoare a pixelului va fi 255 (pixelul 
va fi alb), sau “piper” - adică noua valoare a pixelului va fi 0 (pixelul va 
fi negru). Zgomotul de tip “sare şi piper” (vezi Figura 6.6) este perfect 
decorelat, deoarece între valorile 0 şi 255, şi între coordonatele pixelilor 
afectaţi de zgomot nu există corelaţie. 



Figura 6.6: Zgomotul “sare şi piper”: (a) imaginea originală; (b) imaginea 
cu 10% pixeli afectaţi de zgomot. 


6.4 Alte tipuri de zgomot 

Zgomotele diferă între ele în funcţie de distribuţia care le caracterizează. 
Alte funcţii de distribuţie utilizate sunt: 

• distribuţia Rayleigh: wş(x) = xe 2 

x 2 

• distribuţia Maxwell: wţ(x) = x 2 e~^~ 

• distribuţia Beta: wş(x) = x b (l — x) c 

• distribuţia Gamma (Erlang): wş(x) = x n e~ x 

• distribuţia Laplace: wş(x) = e~\ x \ 

• distribuţia Cauchy: wş(x) = t 2 

Aceste funcţii sunt reprezentate în Figura 6.7. 
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Rayleigh 


Maxwell 


0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 





Figura 6.7: Diverse funcţii de distribuţie. 


DESFĂŞURAREA LUCRĂRII 


Problema 1 . Suprapuneţi zgomot cu distribuţie uniformă peste o imagine 
în tonuri de gri (în meniul Algoritmi, funcţia zgomot_uniform). 







































6.4. ALTE TIPURI DE ZGOMOT 


43 


void ImageViewer :: zgomot_uniform( void ) 

{ 

int i, j ; 

int w = image.width(); 
int h = image .heightO ; 

long int e_zgomot = 0; //energia zgomotului 
long int e_imagine = 0; //energia imaginii 

double SNR; //raportul semnal-zgomot 

//imaginea afectata de zgomot 

Qlmage image_aff( w, h, 32, 0, Qlmage::IgnoreEndian ); 

int med = 0; //media zgomotului 
int dis = 200; //dispersia zgomotului 

for( i = 0; i < w; i++ ) 
for( j = 0; j < h; j++ ) 

{ 

QRgb pixel = image.pixel( i, j ); 
int nivel_gri = qRed( pixel ); 

e_imagine += nivel_gri * nivel_gri; 

//srand( rand() ); 

int zgomot = ( int )( med + sqrt( 3 )* 

(2. * ( rând()/( RAND_MAX + 1. )))*sqrt(dis) ); 
e_zgomot += zgomot * zgomot; 
int val = nivel_gri + zgomot; 

if( val > 255 ) 
val = 255; 
if( val < 0 ) 
val = 0; 

image_aff.setPixel( i, j, qRgb( val, val, val )); 

> 

SNR = 10 * log( 1. * e_imagine / e_zgomot ); 

image = image_aff; 
pm = image; 



44 


LUCRAREA 6. ZGOMOTUL IN IMAGINI 


updateQ ; 

QString mesaj; 

mesaj . sprintf ( "SNR = °/„6.31f dB\ SNR ); 
QMessageBox::about( this, "SNR", mesaj ); 


Problema 2. Modificaţi media şi dispersia zgomotului cu distribuţie 
uniformă (în fişierul algoritmi . cpp, funcţia genereazăjzgomot .uniform). 
Observaţi efectele. 

Problema 3. Suprapuneţi zgomot cu distribuţie gaussiană peste o 
imagine în tonuri de gri (în meniul Algoritmi, funcţia zgomot_gaussian). 
Diferenţa între această funcţie şi cea care generează constă în modul în care 
este calculată valoarea zgomotului, şi anume: 

int zgomot = ( int )( med + sqrt( 2 ) * 

sqrt( -1.* log( rand()/( RAND.MAX + 1. ))) * 
cos( 2 * 3.1415926 * ( rand()/( RAND.MAX+l ))) * 
sqrt( dis ) ); 

Problema 4. Modificaţi media şi dispersia zgomotului cu distribuţie 
gaussiană (fişierul algoritmi . cpp, funcţia generează_zgomot_gaussian). 
Observaţi efectele. 

Problema 5. Suprapuneţi zgomot de tip “sare şi piper” peste o imagine 
în tonuri de gri (în meniul Algoritmi, funcţia zgomot_salt^and_pepper). 
Codul acesteia este prezentat în continuare: 

void ImageViewer :: salt_and_pepper( void ) 

{ 

int i, j, k; 

int w = image.width(); 

int h = image .heightO ; 

double nr = 0.1; //procentul de pixeli afectaţi de zgomot 
srand( rand() ); 
k = 0; 

while( k < ( int )(w*h*nr) ) 

{ 

i = ( int )( 1. * w * rând() / ( RAND.MAX + 1. ) ); 
j = ( int )( 1. * h * rând() / ( RAND.MAX +1. ) ); 


QRgb sare.piper; 
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if( ( 100. * rând() / ( RAND_MAX + 1. ) ) >= 50 ) 
sare_piper = qRgb( 255, 255, 255 ); 
else 

sare_piper = qRgb( 0, 0, 0 ); 

if( (i >= 0) && (i < w) && (j >= 0) && (j < h) ) 
image.setPixel( i, j, sare_piper ); 


k++; 

> 


pm = image; 
updateQ ; 


Problema 6. Modificaţi procentul de pixeli afectaţi de zgomot de tip 
“sare şi piper” (fişierul algoritmi . cpp, funcţia zgomot _salt^and_pepper). 
Observaţi efectele. 
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Lucrarea 7 


Filtrarea imaginilor 


BREVIAR TEORETIC 

Filtrarea imaginilor se înscrie în clasa operaţiilor de îmbunătăţire, princi¬ 
palul scop al acesteia fiind eliminarea zgomotului suprapus unei imagini. 

Filtrarea reprezintă o operaţie de vecinătate. Prin aceasta se înţelege că 
la calculul noii valori a unui pixel vor contribui şi valorile pixelilor vecini, nu 
doar vechea lui valoare, cum se întâmpla la operaţiile punctuale. Vecinii 
unui pixel reprezintă o mulţime de pixeli, aflaţi în apropierea acestuia, 
care alcătuiesc o vecinătate. Această vecinătate poate avea diverse forme 
şi dimensiuni, însă cele mai utilizate în practică sînt vecinătăţile de formă 
pătrată, de dimensiuni impare. 

7.1 Filtrarea liniară a imaginilor 

După cum îi spune numele, acest tip de filtrare respectă principiul liniarităţii 
(sau al superpoziţiei). 

Principiul liniarităţii: Fiind date două imagini fi(x, y) şi f- 2 (x, y ), şi două 
numere reale a şi Ş, se numeşte operator liniar, un operator O care are 
următoarea proprietate: 


O [a • fi(x,y) +/3- f 2 (x,y)] = a ■ 0[fi(x,y)} + (3 ■ 0[f 2 (x,y)\ (7.1) 

Operaţia de filtrare liniară calculează noua valoare a unui pixel al ima¬ 
ginii, din poziţia (m,n), ca o combinaţie liniară a unui număr de valori din 
imaginea originală, astfel: 

g{m , n) = EE Wkl- f(m-k,n-l) (7.2) 

(j k,i) ew 

unde f(x, y) este imaginea originală (afectată sau nu, de zgomot), g(x, y) 
este imaginea filtrată, W este o structură de puncte care defineşte vecinătatea 
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pixelului (■ m,n ), w^i sînt nişte valori constante care reprezintă coeficienţii 
filtrului. 

Filtrul este definit de vecinătatea W şi de coeficienţii wu- Un filtru poate 
fi specificat de o matrice V, care poartă numele de mască de convoluţie 
sau mască de filtrare, care este caracterizată de formă, valorile coeficienţilor 
şi de origine. In Figura 7.1 este prezentată o mască de filtrare de formă 
pătrată, de dimensiune 3x3, având originea în centru. 


W- 1,-1 

w- 1,0 

«>- 1,1 

«> 0 ,-l 

«> 0,0 

«> 0,1 

«> 1,-1 

«> 1,0 

«> 1,1 


Figura 7.1: Mască de filtrare pătrată de dimensiune 3x3. 

Nu este obligatoriu ca forma măştii de filtrare să fie pătrată, de dimen¬ 
siune impară sau să aibă originea în centrul măştii. 

Operaţia de filtrare liniară poate fi descrisă astfel: se suprapune masca de 
filtrare peste fiecare pixel al imaginii originale, astfel încât originea măştii 
să coincidă cu pixelul considerat, apoi se calculează toate produsele între 
coeficienţii măştii şi valorile pixelilor peste care se suprapun aceşti coeficienţi, 
iar suma acestor produse reprezintă noua valoare a pixelului considerat. 
Această tehnică poartă numele de tehnica ferestrei glisante. Operaţia 
descrisă reprezintă de fapt o convoluţie bidimensională. 

7.1.1 Filtrele de netezire 

Filtrele de netezire sunt echivalentele bidimensionale ale filtrelor trece-jos 
(FTJ), şi la fel ca acestea, sînt folosite în general pentru eliminarea zgomo¬ 
tului, care se presupune că este de bandă largă. 

Informaţia conţinută într-o imagine, în general, se regăseşte în compo¬ 
nentele de joasă frecvenţă, şi deci este justificată o filtrare trece-jos pentru 
reducerea puterii zgomotului. 

Zgomotul din imagine se presupune că este aditiv şi pur aleator, adică 
se consideră următoarele ipoteze simplificatoare: 

• g(hj) = f(hj) +n(z,_ 7 ') (zgomotul n este aditiv), 

• n este un semnal staţionar (comportamentul său statistic nu depinde 
de coordonatele i şi j ale pixelului), 
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• n = O (media zgomotului este zero), 

• dacă zgomotul are dispersia <j n , atunci: 

—n —^- T -—^ / a n Pentru h = i 2 & ji = ji 

»<*,*>) = ( „ tnrest 

(zgomotul este complet decorelat). 

Condiţia de normare a coeficienţilor filtrelor de netezire 

Pentru un filtru trece-jos se impune următoarea condiţie: componenta con¬ 
tinuă a imaginii să nu fie alterată de filtru. Cu alte cuvinte, filtrul să conserve 
luminozitatea medie a imaginii. 

Pentru aceasta, considerăm o imagine având un singur nivel de gri, con¬ 
stant, notat cu fi, adică: f(i,j ) = /j, pentru oricare i şi j. Pentru ca filtrul să 
conserve luminozitatea medie, adică valoarea medie /j, impunem g(i,j) = g 
pentru Vi, j. Rezultă: 


H = ^2^2w kr fj, (7.3) 

( k,i) ew 

Y^Yh Wki = l ( 7A ) 

(k,i) ew 

unde w k i > 0. 

Relaţia (7.4) poartă numele de condiţie de normare pentru filtre de 
netezire (sau trece-jos). 

Filtrul de mediere 

Filtrul de mediere este cel mai simplu filtru de netezire. Caracteristic unui 
filtru de mediere este faptul că toţi coeficienţii măştii de filtare sînt egali. 
Dacă ţinem cont şi de condiţia de normare, atunci coeficienţii unui filtru 
de mediere, care are o mască de filtrare de dimensiune N x N, au valoarea 
în Figurile 7.2, 7.3 şi 7.4 sunt prezentate măştile de filtrare de mediere, 
pentru N = 3, 5 şi respectiv 7. 


9 

9 

9 

f 

9 

I 

9 

1 

? 

f 

_ 2 _ 

1 

_ 2 _ 

f 

_ 2 _ 


Figura 7.2: Mască de filtrare pătrată de dimensiune 3x3. 
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Figura 7.3: 


Mască de filtrare pătrată de dimensiune 5x5. 
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Figura 7.4: 


Mască de filtrare pătrată de dimensiune 7x7. 



(a) 


(b) 


Figura 7.5: Filtrarea de mediere: (a) imaginea originală; (b) imaginea fil¬ 
trată cu o mască 7x7. 

Filtrul de mediere nu este folosit în practică, deoarece, pe lângă zgo¬ 
mot, are de suferit şi semnalul util (vezi Figura 7.5). Filtrarea de me¬ 
diere este deranjantă pentru imagine în acele zone în care imaginea conţine 
frecvenţe înalte (variaţii bruşte), pentru că duce la apariţia fenomenului de 
înceţoşare 1 . 

1 (engl.) blurring. 












7.1. FILTRAREA LINIARA A IMAGINILOR 


51 


Din punctul de vedere al zgomotului, pentru filtrare este utilă o mască 
de filtrare de dimensiune cât mai mare. Din punctul de vedere al semnalului 
util, al imaginii, este util ca masca să fie cât mai mică. In practică se 
realizează un compromis între cele două aspecte. 

Alte măşti de filtrare 

Alte măşti de filtrare, pentru filterele de mediere, sunt prezentate în contin¬ 
uare, deşi toate au acelaşi randament nesatisfăcător. 



7.1.2 Filtrele trece-sus 

Filtrele trece-sus urmăresc eliminarea componentelor de frecvenţă joasă din 
imagine. Sunt folosite în general pentru detectarea frontierelor sau contu¬ 
rurilor din imagine, acolo unde au loc treceri sau variaţii bruşte ale luminanţei. 

Condiţia de normare a coeficienţilor filtrelor trece-sus 

Condiţia de normare a coeficienţilor pentru un filtru trece-jos (relaţia (7.6)) 
se determină impunând condiţia ca filtrul să rejecteze complet (sau să atenueze 
complet) componenta continuă a imaginii. 

Pentru aceasta vom considera, la fel, o imagine f(i,j ) = g, pentru Vi, j. 
La ieşirea filtrului trece-sus vom avea g(i,j) = 0 pentru Vi, j. 

0 = (7-5) 

(k,i) ew 

^2^2 Wkl = 0 ( 7 - 6 ) 

(k,i) ew 


Filtrul de accentuare 

Filtrul de accentuare nu este un filtru trece-sus, ci foloseşte filtrarea trece- 
sus pentru a realiza accentuarea. Prin accentuare se înţelege contrastarea 
unei imagini şi are ca scop îmbunătăţirea perceperii vizuale a contururilor 
obiectelor. Cu alte cuvinte, îmbunătăţirea detectabilităţii componentelor 
scenei de-a lungul frontierelor acestora. Acest lucru se realizează, în prin¬ 
cipiu, prin modificarea valorilor pixelilor situaţi de o parte şi de alta a unei 
frontiere comune. 
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Sistemul uman are tendinţa de a adânci profilul zonelor de tranziţie 
dintre regiuni uniforme. Studiul fiziologiei sistemului vizual a demonstrat 
că aceasta se realizează prin prelucrări de tip derivativ ce apar în diferitele 
etape pe care le parcurge informaţia vizuală. Efectul global poate fi mo¬ 
delat matematic prin scăderea din semnalul original a unei derivate secunde 
ponderate. 

In continuare sunt prezentate câteva măşti de implementare a unei derivate 
secunde de tip Laplace: 



In Figura 7.6 puteţi observa efectele filtrării Laplace. 



Figura 7.6: Filtrarea Laplace: (a) imaginea originală; (b) imaginea rezultată 
(negativată). 

Filtrul de accentuare se implementează după schema prezentată în Figura 
7.7. 

7.2 Filtrarea neliniară a imaginilor 

Filtrele neliniare nu respectă principiul liniarităţii sau al superpoziţiei enun¬ 
ţat la începutul lucrării. Acestea au apărut din necesitatea de a depăşi 
limitările filtrelor liniare, în ceea ce priveşte zgomotele care nu au o distribuţie 
normală sau nu sunt aditive. 
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Figura 7.7: Filtrul de accentuare. 

7.2.1 Filtrele de ordine 

Filtrele de ordine sunt operatori locali, definiţi la rândul lor de o fereastră, 
care selectează din imagine un număr de pixeli vecini pixelului curent, într- 
un mod identic cu tehnica ferestrei glisante. Valorile pixelilor selectaţi se 
ordonează crescător. 

Să presupunem că fereastra conţine n pixeli, iar valorile lor formează 
următoarea mulţime: 


{xi,x 2 ,...,x n } (7.7) 

După ce aceste valori au fost ordonate crescător, vom avea: 

{x(l),X( 2 ),"NX(n)} (7.8) 

pentru care sunt îndeplinite următoarele condiţii: 

®(i) < *(2) < - < *(n) (7-9) 

Ieşirea filtrului de ordine de ordin k, pentru k 6 [l;n] întreg, este sta¬ 
tistica de ordinul k. cu alte cuvinte, elementul de pe poziţia k din şirul 
ordonat: 


rank k {xi,x 2 , ■■■, x n } = x (fc ) 


(7.10) 


Filtrul median 

Filtrul median ete un filtru de ordine a cărui ieşire este statistica de ordin 
central, adică elementul ce se află pe poziţia de mijloc a şirului ordonat de 
valori selectate de fereastra de filtrare: 


median{xi, X 2 , •••, x n j 


X ( n±l) 

iHf) + ! x (t+i) 


dacă n este impar , 
dacă n este par. 


(7.11) 
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Filtrul median este potrivit pentru eliminarea zgomotului de tip “sare 
şi piper”. După ordonarea valorilor pixelilor, valorile zgomotului (adică 0 
sau 255) se vor situa pe primele, respectiv ultimele poziţii în mulţime, şi 
deci, la ieşirea filtrului, vom avea o valoare diferită de valorile zgomotului. 
Totuşi există şi situaţii în care, după filtrare, mai există pixeli afectaţi de 
zgomot. In acest caz, spunem că filtrul a fost “străpuns” de zgomot. Acest 
lucru este posibil atunci când mai mult de jumătate din pixelii selectatţi de 
fereastra de filtrare, sunt afectaţi în acelaşi mod (sare sau piper, 255 sau 0) 
de zgomot. 



Figura 7.8: Filtrul median: (a) imaginea originală afectată de zgomot “sare 
şi piper”; (b) imaginea filtrată. 


Filtrul de minim 

Filtrul de minim este un filtru de ordine a cărui ieşire este statistica de 
ordinul 1, adică valoarea xm, care este cea mai mică valoare din mulţimea 
de valori ale pixelilor selectaţi de către fereastra de filtrare. 

Filtrul de maxim 

Filtrul de maxim este un filtru de ordine a cărui ieşire este statistica de 
ordinul n, adică valoarea X( n ), care este cea mai mare valoare din mulţimea 
de valori luate în considerate. 

DESFĂŞURAREA LUCRĂRII 

Problema 1 . Observaţi efectele filtrului de mediere pentru o imagine afec¬ 
tată de zgomot gaussian. Codul C al funcţiei care implementează filtrul de 
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mediere este prezentat în continuare: 

void ImageViewer :: filtru_mediere( void ) 

{ 

int i, j ; 
int k, 1; 
int w, h; 

double v[ 3 ] [ 3 ]; 

//coeficienţii măştii de filtrare 
v[0] [0] = 1./9; v[0] [1] = 1./9; v[0] [2] = 1./9; 

v[1] [0] = 1./9; v[l][l] = 1./9; v[1] [2] = 1./9; 

v[2][0] = 1./9; v[2][1] = 1./9; v[2][2] = 1./9; 

w = image,width(); 
h = image.height(); 

Qlmage image_fil( w, h, 32, 0, Qlmage::IgnoreEndian ); 

for( i = 1; i < w - 1; i++ ) 
for( j = 1; j < h - 1; j++ ) 

{ 

//suma ponderata 
double sum = 0; 

for( k = -1; k < 2; k++ ) 

for( 1 = -1; 1 < 2; 1++ ) 

sum +=v[k+l][l + l] * 
qRed( image.pixel( i+k, j+1)); 

image_fil.setPixel( i, j, 

qRgb( (int)sum, (int)sum, (int)sum )); 

> 

image = image_fil; 
pm = image; 
updateQ ; 

> 

Problema 2. Observaţi efectele filtrului de mediere pentru o imagine 
afectată de zgomot de tip “sare şi piper”. 

Problema 3. Observaţi efectul de “blurring” al filtrului de mediere 
pentru o imagine neafectată de zgomot. 
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Problema 4. Implementaţi un filtru de mediere cu o mască de filtrare 
de formă pătrată de dimensiune 5x5. 

Problema 5. Observaţi efectul filtrului de accentuare (pentru o imagine 
neafactată de zgomot). Codul C al filtrului este următorul: 

void ImageViewer :: filtru_accentuare( void ) 

{ 

int i, j; 
int k, 1; 
int w, h; 

double sum; 
double v[ 3 ][ 3 ] ; 

//coeficienţii măştii 

v[0] [0] = 0; v[0] [1] = -1./4; v[0][2] = 0; 

v[l] [0] = -1./4; v[l][l] = 1; v[l] [2] = -1./4; 

v[2] [0] = 0; v[2] [1] = -1./4; v[2][2] = 0; 

w = image.width(); 
h = image.height(); 

Qlmage image_fil( w, h, 32, 0, Qlmage::IgnoreEndian ); 

for( i = 1; i < w - 1; i++ ) 
for( j=l;j<h-l;j++) 

{ 

sum = 0; 

for( k = -1; k < 2; k++ ) 
for( 1 = -1; 1 < 2; 1++ ) 

sum += 1. *v[k+l][l + l] * 

qRed( image.pixel( i+k, j+1)); 

int niv = qRed( image.pixel( i, j )); 
niv = (int) ( niv + 0.6 * sum ); 

image_fil.setPixel( i, j, qRgb( niv, niv, niv )); 

> 

image = image_fil; 
pm = image; 
update(); 
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Problema 6. Observaţi efectele filtrului median pentru o imagine afec¬ 
tată de zgomot de tip “sare şi piper”. Citiţi şi înţelegeţi implementarea în 
C: 

void ImageViewer :: filtru_median( void ) 

{ 

int i, j; 
int w, h; 
int k, aux; 
int m, n; 
int med; 
int sir [ 9 ] ; 

w = image.width(); 
h = image.height(); 

Qlmage image_fil( w, h, 32, 0, Qlmage::IgnoreEndian ); 

for( i = 1; i < w-1; i++ ) 
for( j = 1; j < h-1; j++ ) 

{ 

//formarea unui sir din elementele vecinătăţii 3x3 
k = 0; 

for( m = -1; m < 2; m++ ) 
for( n = -1; n < 2; n++ ) 

{ 

sir[k] = qRed( image.pixel( i+m, j+n ) ); 
k++; 

> 

//ordonarea crescătoare a valorilor pixelilor 
//metoda BUBBLE SORT 
k = 0; 

while( k == 0 ) 

{ 

k = 1; 

for(m=0; m<8; m++ ) 

if( sir[ m ] > sir[ m + 1 ] ) 

{ 

aux = sir[ m ]; 

sir[ m ] = sir[ m + 1 ]; 
sir[ m + 1 ] = aux; 
k = 0; 


> 
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} 

//elementul median 
med = sir[ 4 ]; 

//noua valoare a pixelului 

image_fil.setPixel( i, j, qRgb( med, med, med ) ); 

> 

image = image_fil; 
pm = image; 
updateQ ; 

> 

Problema 7. Implementaţi filtrul de minim. Observaţi efectele lui 
asupra unei imagini neafectate de zgomot. 

Problema 8. Implementaţi filtrul de maxim. Observaţi efectele lui 
asupra unei imagini neafectate de zgomot. 



Lucrarea 8 


Transformări unitare 


BREVIAR TEORETIC 

Transformările reprezintă o categorie de prelucrări ce include operaţii de tip 
integral, la calculul noii valori a unui pixel al imaginii transformate con¬ 
tribuind valorile tuturor pixelilor din imaginea originală. 

Termenul de transformare se referă la o clasă de matrici unitare folosite 
pentru a reprezenta imagini. O matrice A de dimensiune N x N este unitară 
dacă inversa ei este matricea A* T : 


A-A' 1 = A-A* T = A* T ■ A = I N (8.1) 


unde * reprezintă operaţia de complementare în mulţimea numerelor 
complexe, T reprezintă operaţia de transpunere a unei matrici, iar In este 
matricea identitate de dimensiune N x N: 


In 


(1 

0 

0 

... 0 \ 


0 

1 

0 

... 0 


0 

0 

1 

... 0 

(8.2) 

V o 

0 

0 

... 1 ) 



Pentru un vector uni-dimensional u de dimensiune N, de forma: 


u(0) 

u{ 1) 


u = 


= [u(0),u(l),...,u(N - 1)] T 


L u(N-l) J 

se numeşte transformare unitară directă relaţia: 


(8.3) 
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N-l 

«<*) = E a(k,n)-u(n), 0<k<N — l (8.4) 

n=0 

unde v(k) reprezintă elementele vectorului transformat y_, iar a(k , n) sînt 
elementele matricii A. Matricial această relaţie se poate scrie astfel: 

v = A ■ u 

Transormarea unitară inversă este dată de relaţia: 

N-l 

u(n ) = ^ v(k) ■ a*(k,n), 0 < n < N — 1 

k =o 

care se scrie matricial astfel: 

u = A* T ■ v (8.7) 

Valorile vectorului v sunt o reprezentare a vectorului iniţial u, intr-un alt 
spaţiu. O astfel de reprezentare este utilă în filtrare, compresie, extragere 
de trăsături sau alte tipuri de analiză a imaginilor. 

8.1 Transformări unitare bidimensionale 

Pentru o imagine u(m,n), de dimensiune N x N, transformarea directă are 
următoarea formă: 

N-l N-l 

v(k,l) = EE u(m,n) ■ ai- t i(m,n), 0<k,l<N—l (8.8) 

m= 0 n=0 

iar transformarea inversă: 


(8.5) 

( 8 . 6 ) 


N-l N-l 

u(m, n ) = EE v(k, l) ■ a* k i{m, n), 0<m, n<N— 1 (8-9) 

k =o k =o 

unde coeficienţii {ak : i(m,n)} poartă numele de transformare unitară 
bidimensională, şi reprezintă un set de matrici de bază ortonormale, iar 
v(k,l ) reprezintă transformata imaginii u(rn,n). 

Aceste matrici de bază respectă condiţia de ortonormalitate: 


N-l N-l 

^2 ^22 a kA m ’ n ) • = s(k - k',l - l') 

m =0 Ti—0 


1, k = U kl = l', 

0, în rest. 

( 8 . 10 ) 


pentru Vfc, l. 
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O transformare ca cea dată de relaţia (8.8) este caracterizată de N 4 
coeficienţi akj(m,n). Pentru calculul unui singur element v(k,l) (k şi l 
fixaţi) este nevoie de un număr de N 2 înmulţiri. Prin urmare complexitatea 
întregului calcul este 0(N 4 ). Complexitatea poate fi redusă la 0(N 3 ) dacă 
transformarea este separabilă. 

O transformare este separabilă, dacă elementele aki(m, n ) ce o definesc, 
pot fi scrise ca produs de alte două elemente, grupate după perechi de indici, 
astfel: 


akj(m, n) = afc(m) • bi(n) = a(k, m) ■ b{l , n) (8-11) 

unde, matricile A = {a(k,m)j şi B = {b(l,n)} trebuie să fie la rândul 
lor unitare, adică: 


A ■ A* T = A* t ■ A = I N 

(8.12) 

B ■ B* t = B* t ■ B = I n 

(8.13) 


Dacă transformarea este separabilă, atunci relaţiile (8.8) şi (8.9) devin: 


N-l N-l 


v(k, l ) = ^2 m) ■ u(m, n) ■ b(l , n) 

(8.14) 

771=0 71=0 


N-l N-l 


u(m, n) = ^2 "22 a * m ) ' v ^i 0 ' b*(l, n) 

(8.15) 

k= 0 k= 0 


care pot fi scrise matricial astfel: 


V = A- U ■ B t 

(8.16) 

U = A* T ■ V ■ B* 

(8.17) 


unde U = {u(m,n)} reprezintă imaginea originală, iar V = {v(k,l)} 
reprezintă imaginea transformată. 

In practică se folosesc numai transformări separabile, pentru care, în 
plus, se alege B = A. In acest caz, vom avea o singură matrice A, unitară, 
care defineşte transfomarea, iar relaţiile (8.14) şi (8.15) devin: 

jV-liV-l 

v(k,l) = EE a(k,m) ■ u(m,n) ■ a{l,n) (8.18) 

771=0 71=0 

N-l N-l 

u(m , n) = ^2 a *(^’ m ) ' v ^i 0 ’ a *(h n ) 

k =0 k =0 

Matricial, relaţiile (8.16) şi (8.17) se scriu după cum urmează: 


(8.19) 
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V = A-U ■ A T 

(8.20) 

* 

* 

II 

b 

(8.21) 


8.1.1 Proprietăţile transformărilor unitare 

In continuare vor fi prezentate câteva din proprietăţile transformărilor unitare. 

• O transformare unitară conservă energia semnalului. Această propri¬ 
etate o vom demonstra pentru cazul unei transformări unitare uni¬ 
dimensionale, pentru simplitate, deşi este perfect valabilă şi în cazul 
unei transformări bidimensionale. Fie u un semnal discret uni-dimensi- 
onal, format din N eşantioane, şi o transformare unitară dată de ma¬ 
tricea A. Relaţiile de transformare vor fi: 

v = A ■ u 
u = A* T -v 

Energia semnalului u este dată de norma la pătrat a spaţiului în care 
este reprezentat semnalul: 


E v = ||u|| 2 = I_* T 'O. = (Au)* T -Au = u* T A* T Au = u* T -u = ||u|| 2 = E u 

( 8 . 22 ) 

In general transformarea se alege astfel încât energia să fie inegal dis¬ 
tribuită în spaţiul transformatei, chiar dacă ea era uniform distribuită 
în spaţiul original. 

• Entropia unui semnal discret cu valori aleatoare se conservă printr- 
o transformare unitară. Dar entropia este o măsură a cantităţii de 
informaţie, ceea ce înseamnă că o transformare unitară păstrează infor¬ 
maţia conţinută în semnal. 

• Coeficienţii în spaţiul transformatei sunt decorelaţi sau aproape decore- 
laţi. Transformata optimă care compactează maximum de energie într- 
un număr dat de coeficienţi şi care în acelaşi timp decorelează complet 
aceşti coeficienţi, este transformarea Karhunen-Loeve. 


8.2 Transformata Fourier discretă 

8.2.1 Transformata Fourier unidimensională 

Pentru un semnal unidimensional, u , de dimensiune N, de forma: 
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u= [«(0), «(1), u(N - 1)] T 
transformarea Fourier directă este dată de relaţia: 
N-l 

2,71 j kn 


X—^ / \ ZTtjKn 

v(k ) = 2_ u ( n ) ' e N V k = 0..N — 1 


(8.23) 


(8.24) 


n =0 


iar transformarea Fourieri inversă de relaţia: 
N-l 


u(n) = — v ( k ) 


2njkn 

e n Vn = 0..iV-l 


(8.25) 


k =0 


Astfel definită, transformarea Fourier nu este unitară. Următoarele 
relaţii definesc transformarea Fourier unitară, directă şi inversă: 


l N ~ 1 

v(k) = —= > u(n) ■ 
y/N “. V ^ 

v n=0 


N-l 


27 xjkn 

e — V k = 0..N — 1 


(8.26) 


JL x—"V ziijKn 

u(n) = —j= 2^ v[k) ■ e~N~ V n = 0 ..N — 1 (8.27) 

k=0 

Dacă definim matricea F = {f(k,n)} a transformării, având elementele: 

(8.28) 

atunci transformarea Fourier se poate scrie matricial astfel: 

v = F-u (8.29) 


1 2ir jkn 

f(k,n) = -j=e n k,n = 0..N — l 


u = F*-v (8.30) 

cu observaţia că matricea F are următoarea proprietate: F = F T . 
Pentru calculul transformatei Fourier discrete, există algoritmi rapizi 
(FFT 1 ) care reduc complezitatea calculelor de la 0(N 2 ) la O(NlogN). 


8.2.2 Transformarea Fourier bidimensională 

Pentru o imagine U = {u(m, n)} m>n= 0 ..N- 1 , de dimensiune Nx N, imaginea 
transformată V = {v(k,l)}k,i= 0..N-1 se calculează cu relaţia următoare, ce 
reprezintă transformarea Fourier în ipoteza separabilităţii: 

N-l N-l 

I ^—-v ^—-v 2tt 7 (km-\-ln) 

v(k,l) = — u(m,m) e * (8.31) 

m= 0 n =0 


x Fast Fourier Transform 
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iar transformarea Fourier inversă este dată de formula: 


u(m , n) 


N-l N-l 

k =0 1=0 


27 rj (fcm+Zn) 

. e n 


(8.32) 


Dacă folosim matricea F definită cu relaţia (8.28), atunci matricial se 
poate scrie: 


"7 

II 

C! 

(8.33) 

* 

* 

kn 

II 

b 

(8.34) 


8.3 Transformata cosinus discretă 

Transformata cosinus este o transformată unitară separabilă, definită de 
matricea C = {c(k,n)}, ale cărei elemente sunt date de relaţia: 


c(k , n) 



(2n+l)7rfc 
2N ’ 


k = 0,0 < n < N — 1 


l<fe<AT — l,0<n<iV—1 


(8.35) 


Transformata cosinus, directă şi inversă, pentru un semnal unidimen¬ 
sional, este dată de relaţiile: 


v(k) = a(k ) ^ u(n)cos , 0 < k < N — 1 (8.36) 

n=0 

it(n) = ^ a(k)v(k)cos^--^^-^-, 0 < n < N — 1 (8.37) 

n=0 

unde 

O(0) = ^ “W = 1 < ^ < ^ - 1 (8-38) 

Transformarea cosinus bidimensională, directă şi inversă, este dată de 
următoarele două relaţii, scrise matricial: 

V = C -U -C T (8.39) 

U = C T UC (8.40) 

deoarece matricea C are proprietatea că C = C*, elementele sale fiind 
numere reale. 

Observaţie: transformarea cosinus nu este partea reală a transformării 
Fourier. 
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8.4 Transformata sinus discretă 

Transformata sinus este o transformată unitară separabilă, definită de ma¬ 
tricea S = {s(k,n)}, ale cărei elemente sunt date de relaţia: 


s(k , n) 


n~ ■ 

V N+ l Sm 


(k + 1 )(n + 1)7r 
N + 1 


0 < k,n < N — 1 


(8.41) 


Relaţiile ce definesc transformarea sinus unidimensională, directă şi in¬ 
versă, sunt următoarele: 


v(k) 



(k + l)(n + 1)7r 
N + l 


0 < k<N -1 


(8.42) 


u(n) 



(k + l)(n + l) 7 r 

N + l 


0 < n < N - 1 


(8.43) 


Transformarea sinus bidimensională, directă şi inversă, se scrie matricial 
astfel: 


V = S-U-S 


(8.44) 


U = S-V- S (8.45) 

deoarece matricea S are proprietatea că S = S* = S T = S -1 . 
Observaţie: Transformarea sinus nu este partea imaginară a transformării 
Fourier. 


DESFĂŞURAREA LUCRĂRII 

Problema 1 . Pentru o imagine de dimensiune N x IV, adică pătrată, 
observaţi imaginea transformată obţinută cu ajutorul transformatei cosi¬ 
nus bidimensională (funcţia transformata_cosinus_discreta din meniul 
Algoritmi). Codul acestei funcţii este prezentat în continuare: 

void ImageViewer :: transformata_cosinus_discreta( void ) 

{ 

int w, h; 

int i, j, k; 

double pi = 3.1415926; 


w = image.width(); 
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h = image.height(); 

if( w == h ) 

{ 

int N = w; 
double max = 0; 
double C[ N ] [ N ] ; 

//matricea transformării cosinus 

int U [ N ] [ N ] ; 

//matricea imaginii in spaţiul original 
double V[ N ][ N ] ; 

//matricea imaginii in spaţiul transformatei 
double AUX[ N ] [ N ] ; 

//formarea matricei C a transformării cosinus discreta 
for( i = 0; i < N; i++ ) 

C[ 0 ] [ i ] = 1. / sqrt( N ); 

for( i = 1; i < N; i++ ) 
for( j = 0; j < N; j++ ) 

{ 

C[ i ][ j ] = sqrt( 2./N ) * 

cos( pi * ( 2*j + 1 ) * i / ( 2*N ) ); 

if(C[i][j] > max ) 
max = C [ i ] [ j ] ; 

> 

//formarea matricei U 
for( i = 0; i < N; i++ ) 
for( j = 0; j < N; j++ ) 

U[ i ][ j ] = qRed( image.pixel( i, j )); 

//V = C*U*Ct 

//mai intii vom calcula AUX =0*6 
for( i = 0; i < N; i++ ) 
for( j =0; j < N; j++ ) 

{ 

AUX [ i ] [ j ] =0; 
for(k=0; k<N; k++ ) 

AUX [ i ] [ j ] += C[ i ] [ k ] * U[ k ] [ j ] ; 
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> 

//apoi V = AUX * Ct 
max = 0; 

for( i = 0; i < N; i++ ) 
for( j =0; j < N; j++ ) 

{ 

V[ i ] [ j ] = 0; 
for(k=0; k<N; k++ ) 

V[ i ] [ j ] += AUX[ i ] [ k ] * C[ j ][ k ]; 

if(V[i][j ] > max ) 
max = V [ i ] [ j ]; 

> 

Qlmage transf( N, N, 32, 0, Qlmage::IgnoreEndian ); 

for( i = 0; i < N; i++ ) 
for( j =0; j < N; j++ ) 

{ 

int niv = (int)( V[i][j]* 255 / max ); 
transf.setPixel( i, j, qRgb( niv, niv, niv ) ); 

> 

image = transf; 
pm = image; 
updateQ ; 


Problema 2. Implementaţi transformarea sinus bidimensională. 
Problema 3. Implementaţi transformarea Fourier bidimensională (nu¬ 
mai partea reală, care reprezintă spectrul de frecvenţe spaţiale al imaginii). 

Problema 4. Verificaţi proprietatea de conservare a energiei pentru una 
din transformări. 
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Lucrarea 9 


Compresia imaginilor 


BREVIAR TEORETIC 

Termenul de compresie se referă la totalitatea metodelor ce au drept scop re¬ 
ducerea cantităţii de date necesare pentru reprezentarea unei imagini. Com¬ 
presia este folosită în special pentru stocarea sau transmiterea imaginilor. 

Să considerăm cazul unei imagini de dimensiune 512 x 512 pixeli. Dacă 
aceasta este o imagine în tonuri de gri, iar fiecare pixel este codat cu 8 biţi, 
atunci cantitatea de date necesară pentru a reprezenta această imagine este: 

512 x 512 x 8 = 2 9 x 2 9 x 2 3 = 2 21 « 2 Mb 

Din acest calcul ne putem da seama că pentru a stoca o imagine avem 
nevoie de spaţiu considerabil, iar pentru transmiterea ei avem nevoie de un 
canal de transmisiune de bandă largă, de care nu dispunem întotdeauna. 

9.1 Clasificarea metodelor de compresie 

Metodele de compresie se pot clasifica astftel: 

• Metode de compresie la nivel de pixel 

Aceste metode nu ţin cont de corelaţia care există între pixelii vecini, 
codând fiecare pixel ca atare. Acest tip de compresie este fără pierdere 
de informaţie, adică imaginea iniţială poate fi refăcută perfect din 
imaginea comprimată. Exemple de astfel de metode: 

— codarea Huffman 

— codarea LZW (Lempel-Ziv-Walsh) 

— codarea RLE (Run Length Encoding) 

• Metode de compresie predictive 

Aceste metode realizează compresia folosind corelaţia care există între 
pixelii vecini, dintr-o imagine. Exemple de astfel de metode: 
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— codarea cu modulaţie “delta” 

— codarea DPCM (Differential Puise Code Modulation) 

• Metode de compresie cu transformate 

Aceste metode se bazează pe scrierea imaginii într-o altă bază, prin 
aplicarea unei transformări unitare, atfel încât energia imaginii să fie 
concentrată într-un număr cât mai mic de coeficienţi. 

• Alte metode de compresie 

— cuantizarea vectorială 

— codarea folosind fractali 

— codarea hibridă 


9.2 Algoritmul Huffman 

Să presupunem că valorile pixelilor unei imagini sunt simboluri ale unei surse 


[S\ = {S ll S 2 ,...,S N } (9.1) 

pentru care se cunosc probabilităţile de apariţie: 

[P] = {p 1 ,P2,...,Pn} (9.2) 

P(Si)=pi P(S 2 )=p 2 P(S N )=p N (9.3) 

Aceste probabilităţi nu reprezintă altceva decât frecveţele relative de 

apariţie ale simbolurilor într-un şir de simboluri emise de sursa S. 

Entropia sursei S care generează simbolurile se calculează cu formula: 

N 

H(S) = - • logpi (9.4) 

i= 1 

Ne propunem să codăm simbolurile sursei S cu simboluri ale unei alte 
surse (de exemplu o sursă care generează doar două simboluri: 0 şi 1), astfel 
încât entropia noii surse să fie maximizată. 

In continuare este prezentată o metodă care maximizează această en¬ 
tropie, metodă elaborată de Huffman în 1952: 

Pasul 1. Se ordonează descrescător probabilităţile pi. 

Pasul 2. Se formează un arbore binar, având ca frunze valorile celor 
mai mici probabilităţi din şirul de probabilităţi. Rădăcina acestui arbore 
va conţine suma probabilităţilor celor două frunze ale sale. Se etichetează 
muchia stângă cu 1 şi muchia dreaptă cu 0. 



9.2. ALGORITMUL HUFFMAN 


71 


Pasul 3. Din şirul P se elimină cele două probabilităţi care au fost alese 
ca fiind cele mai mici. In şirul P se introduce valoarea conţinută de rădăcina 
arborelui binar format. 

Pasul 4. Dacă în şirul P există mai mult de un element, atunci se reia 
algoritmul, de la Pasul 1. 

Pasul 5. Codarea binară a fiecărui element se obţine prin parcurgerea 
arborelui ce s-a format, de la rădăcină spre fiecare frunză. 

Eficienţa codificării Huffman este dată de lungimea medie l a cuvintelor 
de cod, care se calculează folosind formula: 


N 

~î — ^ ' li ' Pi 
i= 1 


(9.5) 


unde li este lungimea codului alocat simbolului Si. 

Exemplu: 

Fie o sursă S care generează 4 simboluri, [S 1 ] = {a, 6, c, d}, care au următoarele 
probabilităţi de apariţie: [P] = {0.2; 0.4; 0.1; 0.3}. Arborele codării Huffman 
se construieşte conform etapelor prezentate în Figurile 9.1, 9.2, 9.3 şi 9.4. 



Figura 9.1: Algoritmul Huffman: etapa 1. 



Figura 9.2: Algoritmul Huffman: etapa 2. 
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Figura 9.3: Algoritmul Huffman: etapa 3. 



Figura 9.4: Algoritmul Huffman: etapa 4. 

Pentru decompresie este necesară o tabelă în care să se memoreze cores¬ 
pondenţele între simboluri şi cuvintele de cod. Fără aceasta decompresia 
este imposibil de realizat. 


Simbol 

Cuvânt de cod 

a 

”010” 

b 

55 -^55 

c 

”011” 

d 

”00” 


Lungimea medie a cuvintelor de cod, pentru acest exemplu, este: 

4 

1 = • li = 0,2 • 3 + 0,4 • 1 + 0,1 • 3 + 0,3 • 2 = 1,9 bits/simbol 

i =1 

Dacă nu am fi codat simbolurile, în vederea maximizării entropiei sursei, 
ar fi fost nevoie de 2 biţi/simbol pentru codare. 
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Pentru imagini, probabilităţile de apariţie ale nivelelor de gri se obţin 
prin calcularea histogramei imaginii. Dacă histograma este uniformă, atunci 
algoritmul Huffman de codare nu este eficient, nerealizând nici o îmbunătăţire 
a lungimii cuvintelor de cod. 


9.3 Algoritmul RLE 

9.3.1 Algoritmul RLE pentru imagini binare 

Vom considera valorile pixelilor (0 sau 255) ca fiind simbolurile 0 şi 1 generate 
de o sursă binară. In vederea codării imaginea este transformată într-un şir 
unidimensional, prin concatenarea liniilor sau a coloanelor, ca în Figura 9.5. 




Figura 9.5: Transformarea imaginii într-un şir unidimensional, prin con¬ 
catenarea liniilor. 

Acest şir de elemente 0 şi 1 va fi codat, codarea realizându-se astfel: 
primul element al şirului codat este primul element din şirul de codat; apoi 
se scrie în şirul codat lungimea fiecărui subşir constant din şirul de codat. 

Exemplu: 

şirul de codat: 00000001111100011000000000101000111111111111 
şirul codat: 0753291113 12 

Acest tip de codare se foloseşte în special pentru comprimarea imaginilor 
transmise prin fax. 

Decompresia se face similar cu compresia, parcurgând şirul codat şi 
generând şiruri alternate, de simboluri 0 sau 1, începând cu primul ele¬ 
ment din şirul codat, şi de lungimi indicate de valorile întâlnite în şirul de 
decodat. 

9.3.2 Algoritmul RLE pentru imagini în tonuri de gri 

Pentru imagini în tonuri de gri, algoritmul RLE se aplică pentru plane for¬ 
mate din biţii de pe aceeaşi poziţie, din reprezentarea binară a valorilor 
pixelilor. De exemplu, dacă imaginea în tonuri de gri, are 256 de nivele de 
gri, corespunzător la o cuantizare pe 8 biţi, atunci din această imagine se 
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construiesc 8 plane (sau 8 imagini binare) astfel: o imagine binara formată 
din biţii bo, o altă imagine binară din biţii b i, ş.a.m.d. (vezi Figura 9.6). 



Figura 9.6: Transformarea unei imagini cu 256 nivele de gri, în 8 imagini 
binare. 

Valoarea pixelului (i, j) din imaginea în tonuri de gri va fi reprezentată 
pe 8 biţi astfel: 


val(i,j) = [M 1 M 3 M 5 M 7 ] 

unde bo este cel mai semnificativ bit (MSB 1 ), iar 67 este cel mai puţin 
semnificativ bit (LSB 2 ). 

Imaginea binară formată din biţii cei mai semnificativi va fi comprimată 
cel mai bine cu algoritmul RLE. Imaginea binară formată din biţii cei mai 
puţin semnificativi va fi o imagine cu “purici”, pentru care se poate lua 
decizia de a nu mai fi codată şi deci ignorată. 

9.4 Compresia cu transformate 

Compresia cu ajutorul transformatelor se bazează pe proprietatea acestora 
de a compacta energia imaginii într-un număr redus de coeficienţi, cât mai 
decorelaţi, repartizaţi neuniform în spaţiul transformării. 

Formula care defineşte o transformarea directă este următoarea: 

V = A-U-A t (9.6) 

unde A este matricea ce defineşte o transformare unitară, separabilă. 
Pentru compresia imaginilor, transformarea cea mai apropiată din punct 
de vedere al performanţelor de transformarea optimă Karhunen-Loeve, este 
transformarea cosinus. Coeficienţii de energie mare sunt situaţi în colţul 


1 Most Significant Bit. 
2 Least Significant Bit. 
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Figura 9.7: Transformarea directă. 

din stânga-sus al imaginii transformate, în cazul în care se foloseşte pentru 
compresie transformarea cosinus (vezi Figura 9.7). 



Figura 9.8: Anularea coeficienţilor de energie mică. 

Pentru a obţine o rată de compresie mai mare, vor fi anulaţi coeficienţii 
de energie mică (vezi Figura 9.8). Anularea acestor coeficienţi va duce, însă, 
la scăderea calităţii imaginii după decompresie. Adică, prin transformare 
inversă (vezi Figura 9.9), imaginea obţinută din imaginea V, nu va fi exact 
imaginea originală U. 





Figura 9.9: Transformarea inversă. 


U = A* t -V-A 


( 9 . 7 ) 
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Compresia cu transformarea cosinus stă la baza algoritmului JPEG 3 de 
compresie a imaginilor. 

DESFĂŞURAREA LUCRĂRII 

Problema 1. Implementaţi în C unul dintre algoritmii prezentaţi (Huff¬ 
man sau RLE). Pentru simplitate, imaginea citită în format BMP, va fi 
scrisă într-un format simplificat (vezi funcţia writemakedjlmage, din me¬ 
niul Algortimi). Imaginea comprimată va fi scrisă într-un fişier cu exensia 

. huf sau .rle. 

void ImageViewer :: write_naked_image( void ) 

{ 

int i, j; 
int w, h; 

FILE *file; 

w = image. widthQ ; 
h = image.height(); 

file = fopen( "naked.img", "w" ); 
if( file != NULL ) 

{ 

for( i = 0 ; i < w; i++ ) 

{ 

for( j = 0; j < h; j++ ) 

{ 

int niv = qRed( image.pixel( i, j ) ); 

//nivelul de gri al pixelului 

fprintf( file, "°/ 0 3d ", niv ); 

> 

fprintf( file, "\n" ); 

> 

fcloseţ file ); 

> 

> 


Problema 2. Calculaţi raportul de compresie obţinut, ca raport dintre 
dimensiunile celor două fişiere: cel original (naked. img) în formatul simpli¬ 
ficat şi cel comprimat. 

3 Joint Photographic Experts Group. 
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Problema 3. Observaţi efectul suprimării coeficienţilor de energie joasă, 
la o compresie-decompresie folosind transformata cosinus discretă, (funcţia 
compresie_decompresie_cu_DCT, din meniul Algoritmi). Pentru aceasta 
vizualizaţi imaginea decompresata.bmp. Codul prezentat în continuare pre¬ 
supune că imaginea este pătrată: 

void ImageViewer :: compresie_decompresie_cu_DCT( void ) 

{ 

int w, h; 

int i, j, k; 

double pi = 3.1415926; 

w = image. widthQ ; 
h = image.height(); 

int N = w; 
double max; 

double C[ N ][ N ]; //matricea transformării cosinus 

double U[ N ][ N ]; //imaginea in spaţiul original 

double V[ N ] [ N ] ; //imaginea in spaţiul transformatei 

double AUX[ N ][ N ]; 

// COMPRESIA IMAGINII 

//formarea matricei C a transformării cosinus discreta 
for( i = 0; i < N; i++ ) 

C[ 0 ] [ i ] = 1. / sqrt( N ); 

for( i = 1; i < N; i++ ) 
for( j = 0; j < N; j++ ) 

C[ i ][ j ] = sqrt( 2./N ) * 

cos( pi * ( 2*j + 1 ) * i / ( 2*N ) ); 

//formarea matricei U 
for( i = 0; i < N; i++ ) 
for( j = 0; j < N; j++ ) 

U[ i ] [ j ] = qRed( image.pixel( i, j )); 

//V = c*u*ct 

//mai intii vom calcula AUX = C * U 
for( i = 0; i < N; i++ ) 
for( j = 0; j < N; j++ ) 

{ 

AUX[ i ][ j ] = 0; 
for(k=0; k<N; k++ ) 
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AUX [ i][j ] +=C[i][k] * U[ k ] [ j ]; 

> 

//apoi V = AUX * Ct 
max = 0; 

for( i = 0; i < N; i++ ) 
for( j = 0; j < N; j++ ) 

{ 

V[ i ] [ j ] =0; 
for(k=0; k<N; k++ ) 

V[i][j]+= AUX [ i ] [ k ] *C[j][k]; 

if( V [ i ][ j ] > max ) 
max = V[ i ][ j ] ; 

> 

//anularea coeficienţilor 

//in vederea măririi factorului de compresie 
for( i = 0; i < N; i++ ) 
for( j = 0; j < N; j++ ) 

{ 

if( V [ i ][ j ] < 100 ) //pragul de anulare 
V[ i ] [ j ] = 0; 

//alte valori prag: -500, -100, 0, 100, 500 

> 

// DEC0MPRESIA IMAGINII 
//U = Ct * V * C 
//AUX = Ct * V 
for( i = 0; i < N; i++ ) 
for( j = 0; j < N; j++ ) 

{ 

AUX[ i ][ j ] = 0; 
for(k=0; k<N; k++ ) 

AUX[ i ] [ j ] += C[ k ] [ i ] * V [ k ] [ j ]; 

> 

//apoi U = AUX * C 
for( i = 0; i < N; i++ ) 
for( j = 0; j < N; j++ ) 

{ 

U[ i ] [ j ] =0; 
for(k=0; k<N; k++ ) 
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U[ i ] [ j ] += AUX[ i ] [ k ] * C[ k ] [ j ] ; 

} 

//pseudo-imaginea diferenţa 

Qlmage diff( N, N, 32, 0, Qlmage:: IgnoreEndian ); 

for( i = 0; i < N; i++ ) 
for( j = 0; j < N; j++ ) 

{ 

int dif = abs( qRed( image.pixel( i, j ) ) - 
(int) (U[i][j ] ) ); 
diff.setPixel( i, j, qRgb( dif, dif, dif ) ); 

> 

iio.setlmage( diff ); 

iio.setFileName( "diferenta.bmp" ); 

iio.setFormat( "BMP" ); 

iio.write(); 

> 

Problema 4. Calculaţi eroarea pătratică medie (e) dintre imaginea 
originală şi imaginea obţinută prin compresia şi decompresia cu transformată 
cosinus discretă, folosind formula: 

N-1M-1 

£ = {U -V ) 2 = [“(*> j) - v(i,j)] 2 

i=0 j=0 

Pentru aceasta modificaţi funcţia Compresie-decompresie cu DCT. Ob¬ 
servaţi valorile erorii medii pătratice pentru diverse valori ale pragului de 
anulare a coeficienţilor în spaţiul transformării. 

Problema 5. Observaţi pseudo-imaginea diferenţă, dintre imaginea 
originală şi cea obţinută prin compresia şi decompresia cu DCT, pentru 
diferite valori ale pragului (vezi fişierul diferenta.bmp). 
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Lucrarea 10 


Segmentarea imaginilor 


BREVIAR TEORETIC 

Segmentarea reprezintă împărţirea imaginii în zone de interes, după anu¬ 
mite criterii. Fiecărui pixel i se va atribui o valoare, 0 sau 1, reprezentând 
apartenenţa acestuia la o anumită zonă sau regiune de interes. De regulă, 
segmentarea urmăreşte extragerea, identificarea sau recunoaşterea unui an¬ 
umit obiect dintr-o imagine. Zonele sau regiunile care alcătuiesc o ima¬ 
gine poartă numele de segmente. Pentru o imagine segmentarea 

reprezintă împărţirea lui / intr-un număr N de zone cu i = 1..N, 

ca în Figura 10.1. Aceste segmente se numesc complete, dacă au următoarele 
proprietăţi: 

• fi fi fj = 0 pentru i / j, 

N 

• U fi = f, 

1=1 

• segmentul /* să fie compact, pentru Vz, 

• pentru Vi, un anumit criteriu de uniformitate E(fi ) este satisfăcut, 

• pentru Vi, j, citeriul de uniformitate pentru /, |J fj nu este satisfăcut. 

Metodele de segmentare a imaginilor se pot clasifica în: 

• metode de segmentare orientate pe regiuni 

• metode de segmentare orientate pe contururi 


10.1 Segmentarea orientată pe regiuni 

In general, operaţia de segmentare orientată pe regiuni urmăreşte extragerea 
din imagine a zonelor (regiunilor) ocupate de diversele obiecte prezente 
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Figura 10.1: Exemplu teoretic de segmentare. 


în scenă. Un obiect se defineşte ca o entitate caracterizată de un set de 
parametri ale căror valori nu se modifică în diferitele puncte ce aparţin 
entităţii considerate. Unul dintre cei mai simpli parametri de definiţie este 
nivelul de gri al pixelului. Dacă nivelul de gri caracterizează în mod suficient 
obiectele din imagine, atunci histograma imaginii va prezenta o structură de 
moduri dominante - adică de intervale de nivele de gri ce apar cu probabili¬ 
tate mai mare. Fiecare mod al histogramei va reprezenta câte un obiect sau 
o categorie de obiecte. 


10.1.1 Prăguirea histogramei 

Separarea modurilor histogramei, şi deci identificarea obiectelor din imagine, 
se face prin alegerea unor nivele de gri, numite praguri de segmentare. De 
obicei aceste praguri se aleg ca fiind corespunzătoare minimelor locale ale 
histogramei. Din imaginea iniţială / se construieşte o imagine de etichete g 
(imagine etichetată), conform unei transformări de forma: 


g(m, n) 


E 0 , 0</(m,n)<T*_i 

Ek, T K -i < f(m,n) < L 


( 10 . 1 ) 


In cazul unei histograme bimodale (care conţine două moduri domi¬ 
nante), ca cea din Figura 10.2(a), transformarea de mai sus devine: 


g(m, n) 


E 0 , 0 < f(m, n) <T 

Ei, T < f(m, n) < L 


( 10 . 2 ) 


asemănătoare cu operaţia de binarizare. O astfel de histogramă bi- 
rnodală este caracteristică imaginilor ce conţin un singur obiect sau mai 
multe obiecte de acelaşi fel, pe un fundal uniform. De exemplu, o imagine 
care conţine un scris negru pe un fond alb. 
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(a) 



(b) 


Figura 10.2: Histogramă: (a) bimodala; (b) cu trei moduri dominante. 


10.1.2 Segmentarea prin creştere de regiuni 

Principiul pe care se bazează creşterea regiunilor este următorul: se aleg în 
imagine pixeli reprezentativi pentru fiecare obiect individual, pe baza cărora 
are loc un proces de aglomerare a pixelilor vecini acestora, ce au aceleaşi 
proprietăţi cu pixelii reprezentativi. In urma acestui proces de aglomerare 
se obţin zone de pixeli cu aceleaşi caracteristici. 

Procesul se opreşte în momentul în care fiecare pixel al imaginii a fost 
alocat unei regiuni. Metoda are două etape esenţiale: alegerea punctelor de 
start (puncte iniţiale), numite germeni sau seminţe , şi creşterea propriu-zisă 
a regiunilor. Numărul final de regiuni rezultate este egal cu numărul de 
germeni aleşi iniţial pentru creştere. In principiu, este de dorit ca fiecare 
obiect individual aflat în imagine, să fie marcat de un germene. Daca în 
interiorul unui obiect se găsesc mai mulţi germeni, pentru fiecare dintre ei 
va fi crescută o regiune, fapt ce duce la o segmentare artificială nedorită 
a obiectului respectiv. Acest neajuns poate fi corectat printr-o etapă de 
fuziune a regiunilor adiacente ce au proprietăţi asemănătoare. 

Daca în interiorul unui obiect nu este ales nici un germene, atunci obiec¬ 
tul respectiv va fi inclus în regiunile ce cresc pornind de la germeni din 
vecinătatea sa. 


10.2 Segmentarea orientată pe contururi 

Intr-o imagine, variaţiile de nivel ale pixelilor reprezintă schimbări ale pro¬ 
prietăţilor fizice sau geometrice ale obiectelor ce compun scena. Intr-un 
număr mare de cazuri, aceste variaţii de intensitate corespund frontierelor 
(contururilor) regiunilor determinate de obiectele dintr-o imagine. 
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10.2.1 Tehnicile de gradient 

Principiul acestor metode constă în definirea punctelor de contur ca fiind 
acei pixeli ai imaginii pentru care apar schimbări abrupte ale nivelului de gri. 
Măsurarea acestor variaţii se face prin operatori derivativi de tip gradient. 
Derivata imaginii pe direcţia r, ce face unghiul 0 cu orizontala, este dată de 
combinaţia liniară a derivatelor parţiale pe direcţiile orizontală şi verticală: 


d£ 

dr 


df dx df 8y 
dx dr dy dr 


d J-cose + %,ine 

dx dy 


(10.3) 


di 

dr 


f x cos6 + fysinO 


(10.4) 


Valoarea maximă a acestei derivate, calculate după unghiul 8 este deter¬ 
minată de ecuaţia: 


d 

d8 



care are soluţia: 


—f x sin8 + f y cos 0 = 0 


(10.5) 


9 = arctan 



Pe această direcţie, modulul gradientului este: 


( 10 . 6 ) 



(10.7) 


Din punct de vedere practic, implementarea acestei metode implică cal¬ 
cularea, pentru fiecare pixel al imaginii, a derivatelor parţiale f x şi f y , cal¬ 
cularea modulului gradientului maxim şi a direcţiei acestuia. Valoarea gra¬ 
dientului maxim din fiecare pixel al imaginii este apoi comparată o valoare 
de prag: dacă pragul este depăşit, atunci pixelul este considerat a fi pixel de 
contur. Realizarea derivatelor parţiale după direcţiile orizontală şi verticală 
implică formularea discretă a lui f x şi f y : 


, = df_ = Af(m,n) 
x dx A m 


( 10 . 8 ) 


fy = lt = 


df A f{m,n) 


dy An 

Aceste derivate parţiale discrete pot avea mai multe implementări: 


(10.9) 


fx = f(m, n) - f(m + 1, n) f y = f(m, n) - f(m , n + 1) 


( 10 . 10 ) 
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fx = f(m - l,n) - f(m,n) f y = f(m, n - 1 ) - f(m, n) ( 10 . 11 ) 


fx = f(rn - 1 , n) - f(m + 1 , n) f y = f(m, n-l) - f(m, n + 1 ) ( 10 . 12 ) 

Aceste expresii nu reprezintă altceva decât combinaţii liniare ale valorilor 
unor pixeli din imagine, situaţi în vecinătatea pixelului curent din poziţia 
(m,m). Prin urmare, se pot implementa folosind următoarele măşti de 
filtrare: 


= (1* -i) w v = ( ) 

IU=( 1 -1* ) w v = ( ) 


IV, - ( I 0* -1 ) 


Wy = 



unde prin * am marcat originea măştii de filtrare. O simplificare uzuală 
practică este dată de aproximarea: 


(%) M U I + I f, I (10.13) 

Folosirea măştilor de derivare pe verticală şi orizontală prezentate are 
însă serioase neajunsuri: dimensiunea lor mică face ca rezultatele să fie 
extrem de sensibile la zgomote. In aceste condiţii a apărut ideea naturală 
de a combina filtrarea de derivare cu o filtrare de netezire, care să reducă 
efectele zgomotului. Ceea ce rezultă pentru operatorii de derivare orizontală 
şi verticală sunt măştile: 


W x 


1 0 -1 \ / 1 c 1 \ 

c 0* -c \ Wy = 0 0* 0 

10 — 1 / \ -1 -c -1 / 


(10.14) 


Prin particularizarea valorilor constantei c se pot obţine diverse tipuri de 
operatori de extragere de contur clasici: Prewitt (c = 1), Izotrop (c = \/2) 
sau Sobei (c = 2). In Figura 10.3 puteţi observa efectele extragerii de contur 
folosind operatorul Sobei. 
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Figura 10.3: Filtrul Sobei: (a) imaginea originală; (b) imaginea rezultată. 


10.2.2 Operatorii compas 

Un operator compas este definit de un număr de măşti de derivare, co¬ 
respunzătoare unor filtrări liniare, pe direcţiile principale (verticală, orizon¬ 
tală şi cele două diagonale), în cele două sensuri. Compasul clasic are D = 8 
măşti de filtrare, fiecare dintre ele realizând o derivare după o direcţie mul¬ 
tiplu de 45°. Un exemplu de măşti de derivare direcţională sunt măştile 
următoare, indexate după direcţia geografică pe care se calculează derivata: 


W N 


-1 -1 

0 o 

1 1 



Wnv 


-1 

-1 

0 


-1 

o 

1 


o 

1 

1 


W v 


1 

0 

1 \ 


/O 1 1 \ 

1 

0 

1 

W«?y = 

-! 0 1 

1 

0 

1 / 


V -i -i o 


W s 


1 1 

0 o 

-1 -1 



Wse 


11 o \ 
10-1 
0 -1 -1 / 


We 


î 

0 

-1 \ 


/O -1 -1 \ 

î 

0 

-1 

Wne = 

1 0 -! 

î 

0 

-1 ) 


V 1 1 0 / 


După ce se vor calcula, pentru fiecare pixel în parte, cele opt valori ale 
gradienţilor, corespunzătoare celor opt măşti de derivare: 


fi(m,n) f 2 (m,n) ... f 8 (m,n) 


( 10 . 15 ) 
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se va determina valoarea maximă dintre aceste opt valori. Această va¬ 
loare va fi comparată cu valoarea de prag, iar în cazul în care este mai mare, 
pixelul respectiv va fi considerat pixel de contur. 


10.2.3 Identificarea trecerilor prin zero ale celei de-a doua 
derivate 


Unul dintre principalele dezavantaje ale metodelor de gradient este pre¬ 
cizia slabă de localizare a conturului în condiţiile unei pante puţin abrupte 
(tranziţii slabe, graduale) a acestuia. Derivata a doua poate fi însă folosită 
pentru a marca centrul tranziţiei (trecerea sa prin zero). Operatorul bazat 
pe trecerea prin zero a derivatei secunde este operatorul “zero-crossing”. In 
cazul imaginilor, derivata secundă trebuie luată în considerare după ambele 
direcţii, combinate în laplacian: 

d 2 f d 2 f 

A ' = ă? + ă? < iai6 > 

In continuare sunt prezentate trei măşti ce implementează o derivată 
secundă bidirecţională (operator Laplace): 



Pentru fiecare pixel din imagine se va calcula derivata a doua şi dacă 
aceasta este zero, atunci pixelul este considerat ca fiind pixel de contur. 


DESFĂŞURAREA LUCRĂRII 

Problema 1 . Implementaţi segmentarea prin praguirea histogramei. 
Pentru aceasta veţi folosi codul de la lucrarea nr. 4 (egalizarea histogramei) 
şi imaginea tools.bmp. 

Problema 2. Observaţi extragerea contururilor prin tehnici de gradient, 
folosind un operator Prewitt. 

void ImageViewer :: extragere_contururi( void ) 

{ 


int i, j; 
int k, 1; 
int w, h; 
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int g, gl, g2; 

int hl[ 3 ] [ 3 ] , h2 [ 3 ] [ 3 ]; 


//operatori Prewitt 


hl 

[0] 

[0] 

= -1; 

hl 

[0] 

[1] 

= 0; 

hl 

[0] 

[ 2 ] 

= l; 

hl 

[1] 

[0] 

= -i; 

hl 

[1] 

[1] 

= 0; 

hl 

[1] 

[ 2 ] 

= l; 

hl 

[ 2 ] 

[0] 

= -1; 

hl 

[ 2 ] 

[1] 

= 0; 

hl 

[ 2 ] 

[ 2 ] 

= 1; 

h 2 

[0] 

[0] 

= -1; 

h 2 

[0] 

[1] 

= -l; 

h 2 

[0] 

[ 2 ] 

= -1 

h 2 

[1] 

[0] 

= 0; 

h 2 

[1] 

[1] 

= 0; 

h 2 

[1] 

[ 2 ] 

= 0; 

h 2 

[ 2 ] 

[0] 

= 1; 

h 2 

[ 2 ] 

[1] 

= l; 

h 2 

[ 2 ] 

[ 2 ] 

= 1; 


w = image.width(); 
h = image.height(); 

Qlmage image_ext( w, h, 32, 0, Qlmage::IgnoreEndian ); 

for( i=l;i<w-l; i++ ) 
for( j = 1; j < h - 1; j++ ) 

{ 

gl = 0; 
g2 = 0; 

for( k = -1; k < 2; k++ ) 
for( 1 = -1; 1 < 2; 1++ ) 

{ 

gl += hl[ k + 1 ] [ 1 + 1 ] 

* qRed( image.pixel( i+k, j+1 )); 
g2+=h2[k + 1 ] [ 1 + 1] 

* qRed( image.pixel( i+k, j+1 )); 

> 

g = abs( gl ) + abs( g2 ); 
if( g > 100 ) 

image_ext.setPixel( i, j, qRgb(255,255,255) ); 
else 

image_ext.setPixel( i, j, qRgb(0,0,0) ); 

> 

image = image_ext; 
pm = image; 
update(); 
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Problema 3. Implementaţi operatorul Izotrop de extragere a contu¬ 
rurilor. 

Problema 4. Implementaţi operatorul Sobei de extragere a contu¬ 
rurilor. 

Problema 5. Implementaţi operatorul compas dat drept exemplu. 

Problema 6. Implementaţi extragerea de contururi prin identificarea 
trecerilor prin zero ale derivatei secunde. 

Problema 7. Implementaţi creşterea de regiuni, pornind de la un singur 
germene. Veţi folosi pentru aceasta imaginea tools.bmp. 
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